用户画像-数据埋点

《用户画像(Persona )简介》中提到用户画像构建流程的第一步是数据采集,采集到的数据是否丰富、准确和及时,将直接影响到后面每一步的效果。而数据采集的每一步都是围绕着数据埋点进行的。


概述

数据埋点是数据产品经理、数据运营以及数据分析师,基于业务需求(例如:CPC点击付费广告中统计每一个广告位的点击次数),产品需求(例如:推荐系统中推荐商品的曝光次数以及点击的人数)对用户行为的每一个事件对应的位置进行开发埋点,并通过SDK等技术手段上报埋点的数据结果,记录数据汇总后进行分析,推动产品优化或指导运营。

埋点技术介绍

用户行为数据可以分为服务端和客户端,比较通俗的说:客户端记录操作过程,服务端则记录信息改变过程与结果。

前端埋点

前端埋点作为一个比较成熟并且被广泛采用的数据接入手段已经被广泛应用。目前常见的前端埋点技术有三类:在某个控件操作发生时通过预先写好的代码来发数据的代码埋点;通过可视化界面配置控件操作与事件发生关系的可视化埋点;先收集所有数据再在后端筛选需要分析的对象的“无埋点”。

  • 代码埋点

    代码埋点出现的时间比较早,技术原理也很简单,在APP或者界面初始化的时候,初始化第三方数据分析服务商的SDK,然后在某个事件发生时就调用SDK里面相应的数据发送接口发送数据。例如,我们想统计APP里面某个按钮的点击次数,则在APP的某个按钮被点击时,可以在这个按钮对应的 OnClick 函数里面调用SDK提供的数据发送接口来发送数据。

    代码埋点的优点是一方面使用者控制精准,可以非常精确地选择什么时候发送数据;同时使用者可以比较方便地设置自定义属性、自定义事件,传递比较丰富的数据到服务端。其劣势是首先,埋点代价比较大,每一个控件的埋点都需要添加相应的代码,不仅工作量大,而且限定了必须是技术人员才能完成;其次是更新的代价比较大,每一次更新埋点方案,都必须改代码,然后通过各个应用市场进行分发,并且总会有相当多数量的用户不喜欢更新APP,这样埋点代码也就得不到更新了。

  • 可视化埋点

    可视化埋点的原理是使用可视化的交互手段来代替写代码,把核心代码和配置、资源分开,在APP启动的时候通过网络更新配置和资源,以降低埋点的代价。

  • 无埋点

    “无埋点”就是全埋点,即对所有操作都做埋点,但是根据个人经验和需求来进行埋点的深度的取舍。可视化埋点和“无埋点”二者的区别就是可视化埋点先通过界面配置哪些控件的操作数据需要收集;“无埋点”则是先尽可能收集所有的控件的操作数据,然后再通过界面配置哪些数据需要在系统里面进行分析。

    “无埋点”相比可视化埋点的优点,一方面是解决了数据“回溯”的问题,例如,在某一天,突然想增加某个控件的点击的分析,如果是可视化埋点方案,则只能从这一时刻向后收集数据,而如果是“无埋点”,则从部署 SDK 的时候数据就一直都在收集了;另一方面,“无埋点”方案也可以自动获取很多启发性的信息,例如,“无埋点”可以告诉使用者这个界面上每个控件分别被点击的概率是多大,哪些控件值得做更进一步的分析等等。当然,与可视化埋点一样,“无埋点”依然没有解决覆盖的功能优先,不能灵活地自定义属性,传输时效性和数据可靠性欠佳这几个缺点。甚至由于所有的控件事件都全部搜集,反而会给服务器和网络传输带来更大的负载。

服务端埋点

前端埋点天然的劣势是拿不到在前端不保存的信息,而服务端埋点则可以拿到服务端保存的额外信息,并且信息更加准确。

埋点事件分类

点击事件

点击事件,用户点击按钮即算点击事件,不管点击后有无结果,点击一次记一次。

曝光事件

曝光事件即页面展现的次数,成功打开一次页面记一次,刷新页面一次记一次,加载下一页新页,加载一次记一次。home键切换到后台再进入页面,曝光事件不记。

停留时间事件

表示用户在某一个页面的停留时长记为停留时间,停留时间=用户离开页面时间-用户进入页面时间。(离开页面的动作可以是通过关闭浏览器,或在地址栏键入一个不同的网址,或是点击了网页上的跳转链接等方式定义)

方案选型

并不存在某种普遍完美的可以适应一切场景的数据接入方案,而是应该根据不同的产品,不同的分析需求,不同的系统架构,不同的使用场景,选择最合适的一种接入方案。下面是一些典型的例子:

  • 仅仅是分析UV、PV、点击量等基本指标,可以选择代码埋点或者可视化埋点等前端埋点方案;
  • 精细化分析核心转化流程,则可能需要利用后端 SDK 或者 LogAgent 接入后端日志;
  • 活动/新功能快速上线迭代时的效果评估,则可以利用可视化埋点快速完成;
  • 对客服服务质量的考核,或者不同快递在不同省份运送不同品类产品的速度的比较,则需要使用后端 SDK 来对接第三方系统以便导入数据。
两个基本原则
  • 优先在后端采集数据
  • 属性尽可能采集全面
署的方式
  • 私有化部署
    即部署在自己公司的服务器上,如果期望提高数据安全性,或者定制化的埋点方案较多,则适合私有部署,并开发一套针对自己公司定制化的数据后台查询系统保证数据的安全性和精确性,缺点是成本较高。
  • 接入第三方服务
    优点是成本较低,部分基础服务免费,缺点是:数据会存在不安全的风险,另外一个就是只能进行通用的简单分析,无法定制化埋点方案。

    主要的第三方数据服务商有:百度统计、友盟、Mixpanel、TalkingData、诸葛IO、Sensors Analytics、魔方、Heap、GrowingIO、App Annie、GA(Google Analytics)统计等。

实施流程

数据埋点工作的实施分为三个阶段:计划、执行和验收阶段。

计划

需求owner在确定需求同时提埋点需求,并根据埋点标准格式(根据标准模板)提交指定同事及统计组同事进行初步review,用于确认埋点数据的格式以及合理性,比如有些事件可以做合并,将多个事件转变为一个事件多个属性等。指定同事确认没有问题后提交开发进行确认和埋点。

执行

各端开发根据已确认的埋点需求文档进行埋点。

验收

  1. 在测试阶段,开发会提供埋点的debug包,需求owner可以通过触发指定的事件,然后根据界面显示所被触发的事件进行简单的验证;
  2. 上线前,指定同事会通过平台查看埋点数据的情况,做二次确认;
  3. 上线后,需求owner会观察线上数据是否有异常;

参考资料

http://www.gameres.com/702801.html
https://www.sensorsdata.cn/blog/shu-ju-jie-ru-yu-mai-dian/
https://blog.csdn.net/hackeey/article/details/78016979
https://www.zhihu.com/question/23078534
http://www.woshipm.com/data-analysis/664513.html
http://www.woshipm.com/data-analysis/872543.html
http://www.woshipm.com/data-analysis/879349.html
http://www.woshipm.com/data-analysis/756489.html
http://www.woshipm.com/tag/%E6%95%B0%E6%8D%AE%E5%9F%8B%E7%82%B9

猜你喜欢

转载自blog.csdn.net/ifwinds/article/details/79735749