Дорога больших данные Week08_day02 (Flume архитектуры, и установка)

Flume архитектура, и установка

ОТ РЕДАКЦИИ
Перед изучением новой технологии, мы должны знать об этом материале , что толку? Мы можем использовать его , что делать? Если коротко, то анализ большого регистрации данных Флюма не может обойтись без компонента, может быть использовано в технологическом потоке, он также может быть использован в пакетных данных.
1. Обработка потока:
Запись фотографий описано здесь
2. Offline Batch:
Запись фотографий описано здесь
Анализ: Если вы находитесь в режиме реального времени потоковое данных, или в автономном режиме пакетной передачи данных, используется желобе будет делать это коллекция журналов базы для сбора логов. Таким образом, это исследование Этот компонент является очень важным. Использование этого компонента очень просто.

Brief транспортер
транспортер является распределенными, безопасными, доступными услугами, для эффективного сбора, полимеризуются и перемещения больших объемов данных. Он имеет архитектуру потока данных на основе простой и гибкой. Он имеет регулируемую надежность механизма и множество механизмов перемещения при сбое и восстановления, является надежной и отказоустойчивостью. Он использует простую модель данных может быть расширен, что позволяет онлайн аналитических приложений.
Резюме Приговор: Flume используется , чтобы сделать инструмент сбора журнала такой

Flume архитектура описывает
Запись фотографий описано здесь
1) Источник собраны (считывают данные с канала на веб - сервер)

агрегирование каналов 2) (сокращение прямых общего пользования и количество док-диска (производственная среда тип памяти), когда канал полон, то пишите тонуть идти. В то же время, также играет роль в отказоустойчивой, потому что только тогда, когда приемник был получен данные, канал будет отбрасывать исходные данные)

3) выход приемника (считывать данные из канала и записываются в пункт назначения, где адресат может быть HDFS, некоторые из оставшейся файловой системы или в качестве источника следующего агента и т.д.)

Кстати,
понятие События
передачи всего процесса сбор данных, агрегированный поток , что событие, то есть, чтобы гарантировать , что сделка осуществляется на уровне событий.
Так что же такое событие этого? --Event переданного пакета данных, он является основной единицей водослива передачи данных, если он представляет собой текстовый файл, как правило , строку, основная единица является событием транзакции.
От исходного события, поток канал, а затем тонет, сам массив байт, и несет заголовки (заголовок) информацию. Минимальное Целостность событие представляет собой блок данных, из внешнего источника данных, к месту назначения наружу.
Для того , чтобы облегчить понимание, дает поток данных диаграммы события:
Запись фотографий описано здесь

Эта статья цитируется выше от Великого Бога «тихого контроля технологии», потому что я думаю, что Бог был объяснен очень большое место. Ну понятно, здесь, слава Богу, большой

Мы должны сначала своей прибыли

Поскольку некоторые маленькие партнеры не могут быть установлены водоводными компонентами, а затем мы начали вводить водовод установки.

Я здесь, чтобы предоставить водовод архив Baidu Cloud Link

Ссылка: https: //pan.baidu.com/s/1Cso3Bbo1JnoRdNboJuvpfQ
код извлечения: hod9 

 

Простая установка, распаковка и установка

Установка.

1. Xftp .gz пакет загружен в виртуальную машину

  1. деготь zxvf апач-лотковый-1.8.0-bin.tar.gz

Переименовать: мв апач-лоткового-1.6.0-бен желоб

Open VI / и т.д. / профиль

  1. среда конфигурации суммы переменного желоб

Добавить #Flume

 

 

экспорт FLUME_HOME = / USR / местные / мягкий / желобе

экспорт PATH =.: $ JAVA_HOME / bin: $ FLUME_HOME / bin: $ PATH

 

 

 

 

Сохранить и выйти

运 ⾏ источник / и т.д. / профиль

 flume-ng version 输出版本信息表示安装正确

 

 

安装完成,是不是及其简单。

 

 

 

博客参考 https://www.cnblogs.com/liuge36/p/9883030.html

 

 

写在前面
在学习一门新的技术之前,我们得知道了解这个东西有什么用?我们可以使用它来做些什么呢?简单来说,flume是大数据日志分析中不能缺少的一个组件,既可以使用在流处理中,也可以使用在数据的批处理中。
1.流处理:
Запись фотографий описано здесь
2.离线批处理:
Запись фотографий описано здесь
分析:不管你是数据的实时流处理,还是数据的离线批处理,都是会使用flume这个日志收集框架来做日志的收集。因此,学习这个这个组件是很重要的。这个组件的使用也是很简单的。

简单介绍一下Flume
Flume是一种分布式的、可靠的、可用的服务,用于高效地收集、聚合和移动大量日志数据。它具有基于流数据流的简单灵活的体系结构。它具有可调的可靠性机制和许多故障转移和恢复机制,具有健壮性和容错性。它使用一个简单的可扩展的数据模型,允许联机分析应用程序。
一句话总结:Flume就是用来做日志收集的这么一个工具

Flume架构介绍
Запись фотографий описано здесь
1) Source 收集 (从webserver读取数据到Channel中去)

2) Channel 聚集 (减少直接与磁盘的对接次数(生产环境中一般使用类型为Memory),当channel满了,再写到sink中去。同时,也起到了容错的作用,因为只有当sink接收到了数据,channel才会把原有的数据丢弃)

3) Sink 输出(从channel中读取数据,写到目的地,这里的目的地可以是HDFS、其余的一些文件系统或者作为下一个agent的source等)

顺便说一下
Event的概念
在整个数据的收集聚集传送的过程中,流动的是event,即事务保证是在event级别进行的。
那么什么是event呢?—–event将传输的数据进行封装,是flume传输数据的基本单位,如果是文本文件,通常是一行记录,event也是事务的基本单位。
event从source,流向channel,再到sink,本身为一个字节数组,并可携带headers(头信息)信息。event代表着一个数据的最小完整单元,从外部数据源来,向外部的目的地去。
为了方便大家理解,给出一张event的数据流向图:
Запись фотографий описано здесь

上面这段引用来自大神“安静的技术控”的文章,因为我觉得大神已经解释得很到位了。很好理解,在这里,感谢大神啦

工欲善其事,必先利其器

因为有的小伙伴可能还没有安装flume组件,接下来我们就开始介绍一下flume的安装。

我这里提供了flume的压缩包百度云链接

链接:https://pan.baidu.com/s/1Cso3Bbo1JnoRdNboJuvpfQ
提取码:hod9 

 

安装方式及其简单,解压及安装

安装。

1. 通过Xftp把.gz包上传到虚拟机

  1. tar zxvf apache-flume-1.8.0-bin.tar.gz

重命名:mv apache-flume-1.6.0-bin flume

打开 vi /etc/profile

  1. 配置flume环境变量量

添加#Flume

 

 

export FLUME_HOME=/usr/local/soft/flume

экспорт PATH =.: $ JAVA_HOME / bin: $ FLUME_HOME / bin: $ PATH

 

 

 

 

Сохранить и выйти

运 ⾏ источник / и т.д. / профиль

Yun  указывает правильно установлена информация о версии Версия вывода желобе-нг

 

 

Установка завершена, и не просто.

 

 

 

Блог ссылка  https://www.cnblogs.com/liuge36/p/9883030.html

 

 

рекомендация

отwww.cnblogs.com/wyh-study/p/12093483.html