hadoop第一天——4. 大数据分析系统

四、大数据分析系统

  1. 概述
    按照数据的流转流程,把数据分析中各个模块连接起来就构成了大数据系统。模块包括:
         - 数据采集(收集)
         - 数据存储
         - 数据计算
         - 数据分析
         - 数据应用

          此外会根据数据的时效性,从产生到具体应用之间的时间间隔,分为离线计算、实时计算。
               - 离线计算(处理):处理历史数据,面向过去分析,称之为批(batch)处理。
               - 实时计算(处理):处理当下实时产生的数据,称之为流(stream)式处理。
          所谓的时效性是以人能接受作为标准。

  1. 网站流量日志数据分析系统
    系统意义:帮助网站管理员、运营人员、推广人员等实时获取网站流量信息,并从流量来源、网站内容、网站访客特性等多方面提供网站分析的数据依据。从而帮助提高网站流量、提升网站用户体验,让访客更多的沉淀下来变成会员或客户,通过更少的投入获取最大化的收入。

猜你喜欢

转载自blog.csdn.net/qq_28178795/article/details/92076191