出处:数据分析产品的下一个进化:基于无埋点的有埋点

一直以来,人们把大数据和埋点技术紧紧捆绑在一起,大数据时代也被称为埋点时代。技术发展,更新更快的无埋点技术横空出世。那么埋点技术是不是就此被判了死刑,无埋点就是万能的了? 非也,二者只会进化的更为高级。

为什么这样说呢?其实从埋点技术的诞生和发展不难看出,一切都是源于大数据的发展,对数据的需求更加全面和精准,为适应这种发展,埋点技术不断更新迭代。这也是大数据发展的根源。

埋点的进化发展史
互联网发展起始阶段,用户不关心流量,没有意识到需要检测网站信息,一切都处在野蛮生长的阶段,随着时代的进步,业务也在增长,网站的流量开始增多,这时大家意识到这些数据中蕴含着大量的用户信息,加之用户需求越来越复杂,这时运营人员就需要一些关键的数据作为参考。

比如一些互联网公司,发展到一定程度,都会有专门的数据团队或者兼职数据人员,对公司的一些业务指标负责。同时产品的迭代升级同样需要大量的数据来支撑,如果没有数据指标的支撑,又怎么衡量这个功能升级是不是合理的呢?互联网产品并不是功能越多就越好,产品是否经得起用户考验,还是要基于数据说话的,然后学习新知识,用于下一轮的迭代。于是,埋点就此诞生了!

从埋点发展到今天的无埋点经历三个阶段的升级。

1 代码埋点
第一阶段是代码埋点,最初的埋点是在代码的关键部位植入N行代码,追踪用户的行为,得到想要的数据。挖开产品本身,找到收集点.进行源源不断的传递数据。简单的说,找节点,布代码,收数据。

但随着业务规模扩大,数据需求增多,埋点效率低下,采集成本过高等问题开始暴露,这时候新的埋点技术出现了,即第二阶段框架式埋点。

2 框架式埋点
框架式埋点也称“可视化埋点”。用框架式交互手段来代替纯手工写代码,固化相应代码的做为SDK,方便直接调用.这是一个非常大的进步。框架式埋点很好地解决了代码埋点的埋点代价大和更新代价大两个问题。但框架式埋点能够覆盖的功能有限,关键在于不是所有的控件操作都可以通过这种方案进行定制,而且数据收集难度加大,因此无埋点技术走入了大众的视线。

3 无埋点
“无埋点”则是先尽可能收集所有的控件的操作数据,然后再通过界面配置哪些数据需要在系统里面进行分析。“无埋点”相比框架式埋点的优点,一方面是解决了数据“回溯”的问题,另一方面,“无埋点”方案也可以自动获取很多启发性的信息。

无埋点大大减少了开发人员的开发成本及技术和业务人员的沟通成本。可以说无埋点技术的出现,最大化的提升了数据收集的速度,大幅缩短了数据收集周期,使得原来不敢想的事情现在敢做了,原来碍于必须有时效性不敢收集的数据也可以迅速进行分析了,在这点上,无埋点技术对传统埋点技术的优势巨大。那么发展到无埋点是否就此为止了呢?答案是否定的。

无埋点上的有埋点
从埋点到无埋点,每个阶段的演变都是顺应时代发展的需求,二者不是简单的被淘汰,而是在原来的基础上更新迭代,回到根源上来说,对数据的全面和精准,也是技术进化的一个催化加。因此我们有理由大胆猜测,数据分析技术只会继续下一个阶段的进化,基于无埋点上的有埋点,支持我们的理由是什么?

首先我们了解一下它的概念,所谓无埋点技术,并不是说完全不用在App中植入代码,而是需要调用SDK代码,在应用页面的加载过程中、点击事件传播过程中、在其中间的某个点自动嵌入监测代码来采集数据。简单来说,就是通过简单的引入一段代码来实现监测。

目前主流的APP监测,引入监测方的SDK;网站端监测,则引入监测方的JS文件,通过引入的SDK或者JS文件来实现对APP或者网站的流量、页面热点、用户数等等这类基础数据的统计分析。因此无埋点,并非完全不埋点,只是少埋点,不是大家理解的不埋任何代码就能实现监测,无埋点不能脱离有埋点独立存在的。

其次,虽然无埋点看似十分先进,但也同样存在一些弊端,不能灵活地自定义属性,传输时效性和数据可靠性欠佳,由于所有的控件事件都全部搜集,给服务器和网络传输带来更大的负载;现有的无埋点技术并非官方标准方案,有可能在未来无法使用;监测需求相对比较基础,更多的是依据流量、用户、热点的一些分析统计,不涉及到一些自定义、或者更细化的统计分析,比如每个订单、 会员的监测;或者页面存在jQuery时对页面热点的监测。

比如我们以APP来说,APP所有新闻页、产品详情页的类名都是一个,那么无埋点就无法区分不同新闻页或者产品详情页的数据,这就影响到了数据的精准,这种情况下就需要添加代码来实现。

就比如城市要铺设新的业务管道,那必须开挖路面,光看是不行的,同时要计量或控制管道的流量大小,知道管道里的流动情况,就必须在相应的节点上装相应的阀门,这就好像埋点一样。

有时一些特殊需求或者特殊格式,也需要额外手动发送请求代码来实现,比如滚动条高度、及其它稍复杂的监控都无法做到,如果需要采集全方位的数据进行更专业的分析,仍需要靠开发人员来埋点配置。

可见,无埋点在数据监测中并不能做到全面。这就注定埋点技术不会安安静静的选择“狗带”,无埋点技术又不是吹嘘的十分万能。实现全面监测,将二者有效的结合在一起才是发展的正理。

因此在基于无埋点的基础上,通过一些手动发送请求方式(也就是所谓的埋点),来实现全面监测,这是目前行业需求和技术发展的主流方向,这种技术既解决了数据分析中的弊端,又确保了数据的精准性,同时也具备很强的扩展性。

我们静待下一个进化阶段的到来!

数据埋点是什么?设置埋点的意义是什么?

原文出处https://www.zhihu.com/question/36411025

作者:国双商业市场
链接:https://www.zhihu.com/question/36411025/answer/144973846
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

所谓“埋点”,是数据采集领域(尤其是用户行为数据采集领域)的术语,指的是针对特定用户行为或事件进行捕获、处理和发送的相关技术及其实施过程。

埋点的技术实质,是先监听软件应用运行过程中的事件,当需要关注的事件发生时进行判断和捕获,然后获取必要的上下文信息,最后将信息整理后发送至服务器端。所监听的事件,通常由操作系统、浏览器、APP框架等平台提供,也可以在基础事件之上进行触发条件的自定义(如点击某一个特定按钮)。一般情况下,埋点可以通过监测分析工具提供的SDK来进行编程实现。

埋点的业务意义显而易见,即帮助定义和获取分析人员真正需要的业务数据及其附带信息。在不同场景下,业务人员关注的信息和角度可能不同。典型的应用场景有面向数字营销领域的分析,以及面向产品运营领域的分析。前者注重来源渠道和广告效果,后者更在意产品本身流程和体验的优化。两者各有侧重,也可以有一些交叉。所以,对于不同的项目和分析目的,应当设计不同的埋点方案。

近年来,埋点的方法论上也出现了一些业界新趋势,如“无埋点”技术。所谓“无埋点”,是指不再使用笨拙的采集代码编程来定义行为采集的触发条件和后续行为,而是通过后端配置或前端可视化圈选等方式来完成关键事件的定义和捕获,可以大幅提升埋点工作的效率和易用性。在“无埋点”的场景下,数据监测工具一般倾向于在监测时捕获和发送尽可能多的事件和信息,而在数据处理后端进行触发条件匹配和统计计算等工作,以较好地支持关注点变更和历史数据回溯。当然,即便是“无埋点”技术,也仍然需要部署数据采集基础SDK(又称基础代码),这一点需要注意,容易产生误区。

如果需要了解更多关于埋点的详细信息,可以阅读宋星的文章: http://www.chinawebanalytics.cn/auto-event-tracking-good-bad-ugly/

作者:马天云
链接:https://www.zhihu.com/question/36411025/answer/133787143
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

数据埋点分三个阶段:

初级的数据埋点:在产品流程关键部位植相关统计代码,用来追踪每次用户的行为,统计关键流程的使用程度。

中级的数据埋点:在产品中植入多段代码追踪用户连续行为,建立用户模型来具体化用户在使用产品中的操作行为。

高级的数据埋点:与研发及数据分析师团队合作,通过数据埋点还原出用户画像及用户行为,建立数据分析后台,通过数据分析、优化产品。

埋点的意义:

数据埋点为了统计分析的需要,对用户行为的每一个事件进行埋点布置,并对这些数据结果进行分析,进一步优化产品或指导运营。

作者:大头鱼

链接:https://zhuanlan.zhihu.com/p/25195217

来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

所谓埋点就是在应用中特定的流程收集一些信息,用来跟踪应用使用的状况,后续用来进一步优化产品或是提供运营的数据支撑,包括访问(Visits),访客(Visitor),停留时间(Time On Site),页面查看(Page Views,又称为页面浏览)和跳出率(Bounce Rate,又可称为蹦失率)。这样的信息收集可以大致分为两种:页面统计(track this virtual page view),统计操作行为(track this button by an event)。

数据埋点的方式

现在埋点的主流有两种方式:

第一种:自己公司研发在产品中注入代码统计,并搭建起相应的后台查询。
第二种:第三方统计工具,如友盟、百度移动、魔方、App Annie、talking data等。

如果你的数据来自第二种,那你使用的工具也应该是第三方统计工具,后续没啥数据产品了,好好用这些产品吧。这里说说第一种的埋点方式吧,怎么数据埋点,就需要根据自己产品的任务流及产品目标来设计。

关键指标

我们先看看无论是APP还是H5都会关注的指标,了解这些指标的计算方法的细微差异以及复杂性,换个角度来思考埋点的意义。【源自:精通Web Analytics 2.0】

访问与访客

访问(Visits)与访客(Vistors)是几乎所有应用都需要统计的指标,这也是最基础的指标。

对于应用的统计来说,希望统计的是访客(Vistors)。访问(Visits)是指会话层,用户打开应用花一段时间浏览又离开,从指标定义来说这杯称之为一个会话(Session)。一次会话(Session 或 Visit)是打开应用的第一个请求(打开应用)和最后一个请求决定的。如果用户打开应用然后放下手机或是离开电脑,并在接下来30分钟内没有任何动作,此次会话自动结束,算作一次访问或会话期。

在计算访客时,埋点上报的数据是尽可能接近真实访客的人数。对于独立访客这个指标,这里还是需要强调一下,独立访客数并不是真实独立的人,因此收集数据时必须知道独立访客虽然能够很好的反映使用应用的真实访问者的数量,但不等于使用应用的真实人数。

原因是,重复安装的应用,或是手机参数被修改都会使得独立访客的指标收到影响。独立访客的埋点都是依赖Cookie,用户打开应用,应用都会在此人的终端创建一个独立Cookie, Cookie会被保留,但还是难免会被用户手动清理或是Cookie被禁用导致同一用户使用应用Cookie不一致,所以独立访客只能高度接近于使用应用的真实人数。

停留时长

停留时长用来衡量用户在应用的某一个页面或是一次访问(会话)所停留的时间。

页面停留时长,表示在每个页面所花费的时间;例如:首页就是进入首页(10:00)到离开首页进入下一个页面(10:01)的时长,首页停留时长计算为1分钟。页面A是2分钟。页面B进入时间(10:03),离开时间没有记录,这时候计算就是0 ,这种特殊情况的处理是需要在埋点特别注意的,还是那句话,不要尝试收集绝对精准的数据,要学会使用不全的数据,活学活用。

应用的停留时长,表示一次访问(会话)所停留的时间,计算起来就是所有页面的访问时长,同样是上一个流程,应用的停留时长就是4分钟。

跳出率

跳出率的计算方法现在在各个公司还是很多种,最精彩被使用的是:单个页面访问的所占的会话比例。这种场景意味着用户来了访问了一个页面就离开了,想想用户使用的心里画面应该是:打开应用,心想什么鬼,然后关闭应用甚至卸载了。这个场景多可怕,这也是为什么跳出率指标被如此关注。

跳出率可以分解到两个层次:一是整个应用的跳出率,二是重点的着陆页的跳出率,甚至是搜索关键词的跳出率。跳出率的指标可操作性非常强,通过统计跳出率可以直接发现页面的问题发现关键词的问题。

退出率

退出率是针对页面的,这个指标的目标很简单,就是在某个页面有多少用户离开这个页面,主要用户反映用户从应用离开的情况。哪些页面需要被改进最快的方式被发掘。(有些流程中设定走完标准流程,退出率最高的在标准流程的最后的页面反映的正向呢,不要认为退出率高都是坏的事情哦)

转化率

我们在产品上投入这么多,不就是为了衡量产出么?所以对于电商类应用,还有比转化率更值得关注的指标吗?转化率的计算方法是某种产出除以独立访客或是访问量,对于电商产品来说,就是提交订单用户数除以独立访客。

转化率的计算看起来想到那简单,但却是埋点中最贴近业务的数据收集。这也是最体现埋点技巧的指标,需要结合业务特点制定计算方法。提交订单量/访客数是最基本的转化率,转化率还可以分层次,指定用户路径的,如:完成某条路径的提交订单数/访客数。

试着找一条路径,想想转化率的数据怎么得来的吧,埋点都收集了什么样的数据吧?

参与度

参与度并不是一个指标,而是一系列的指标,访问深度,访问频次这些都是衡量参与度的指标。之所以把参与度列为一个指标,是希望大家明白把指标组合后续产生化学反应,发现实物的本质。

埋点的内容

看完关键的这些指标后,有没有发现埋点的来源也大致分为两部分,一部分是统计应用页面访问情况,即页面统计;另外一部分是统计应用内的操作行为,及自定义事件统计。

页面,事件都被唯一标记,用户的信息,设备的信息,时间参数被附加上报。这就是埋点。

关于埋点的数据的注意事项

不要过分追求完美
关于埋点数据有一点至关重要,埋点是为了更好地使用数据,不要试图得到精准的数据要得到的是高质量的埋点数据,前面讨论跳出率就是这个例子,得到能得到的数据,用不完美的数据来达成下一步的行动,追求的是高质量而不是精确。这是很多数据产品容易入坑的地,要经常提醒自己。

作者:赵素卫
链接:https://www.zhihu.com/question/36411025/answer/139101494
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

数据埋点是一种良好的私有化部署数据采集方式。数据采集准确,满足了企业去粗取精,实现产品、服务快速优化迭代的需求。 简单的说:找节点, 布代码, 收数据。

数据埋点可以分为三个阶段: 代码埋点 、 框架式埋点 (也称为可视化埋点)以及无埋点。

但随着业务规模扩大,数据需求增多,埋点效率低下,采集成本过高等问题开始暴露, 越来越多的公司开始注重无埋点技术。

曾经在一个公众号中,看过一篇文章,写的不错,推荐给您!我上面说的,大多也是摘自这里

https://mp.weixin.qq.com/s/VSIQ9SuizaBo8KTCXQxZkQ

数据分析第一步–做好数据埋点

做产品的同学在产品上线后经常离不开一个词,数据分析。那么要如何进行数据分析呢?不妨先问自己这么几个问题。
1.你要分析什么问题?是找问题还是验证?
2.关于这些问题你需要哪些数据?
3.这些数据从哪里来?

要怎么解决这些问题呢?答案是数据埋点。首先通过产品定位及目标来确定自己需要哪些数据,其次通过在产品各个流程环节中设置数据埋点,最后,当用户使用产品时,后台就能源源不断地接收到数据了。

那么,问题又来了。如何做好数据分析的第一步,数据埋点呢?还是从三个问题来回答
1.数据埋点是什么?
初级的数据埋点:在产品流程关键部位植相关统计代码,用来追踪每次用户的行为,统计关键流程的使用程度。
中级的数据埋点:在产品中植入多段代码追踪用户连续行为,建立用户模型来具体化用户在使用产品中的操作行为。
高级的数据埋点:与研发及数据分析师团队合作,通过数据埋点还原出用户画像及用户行为,建立数据分析后台,通过数据分析、优化产品。

2.为什么要做数据埋点?
一个简单的逻辑:你不做数据埋点,你就做不了数据分析。你不做数据分析,你就会不知道产品上线情况。你不知道产品上线情况,你产品就会做差。你产品做差,你的业绩就会不好。你业绩不好你就会被辞,你被辞就会没钱。你没钱就会去睡马路。你睡马路你就可能会被车撞,你被车撞就会…
所以为了不被车撞,一定要做好数据埋点!

3.怎么做好数据埋点?
(1) 数据埋点的内容
![Upload 数据埋点 (1).png failed. Please try again.]
数据埋点可以分为产品内部埋点和市场埋点,内部埋点通常分析用户使用产品的行为及流程,提升用户体验。市场埋点分析该产品在市场上的表现及用户使用场景,如产品在不同市场和地域的下载量,不同地域人群使用时间等等。

产品流程通常分为主干流程和分支流程,所以相应的数据埋点可以分为主干埋点和分支埋点,数据埋点通常不会一步搞定,在产品的第一次上线时通常会埋以下几个点:PC&Web端会统计产品的PV/UV,注册量,主要流程页面之间的转化率、日活人数等等。而移动端还要统计产品在Appstore,各大安卓市场的下载量。

第二次埋点会根据产品目标及上线后的问题进行分析。比如,当你发现产品首页的UV很高, 注册量却非常低,你就需要分析出用户在首页的行为,如30%的用户退出了产品,60%的用户进入了注册页,但只有1%的用户注册了该产品。这也就意味着,注册流程可能出现了问题,需要进一步细化注册各个流程,增加数据埋点,分析各个流程之间的转化率,找到产品出现的问题并解决。

具体到自己的产品,怎么数据埋点,就需要根据自己产品的任务流及产品目标来设计。这是一个由粗到细,优化迭代的过程。

(2)分析方法
任务流程分析法:根据产品设计的任务流,在任务流开始和结束处埋点,分析用户处理任务的情况。
页面转化分析法:统计相关页面的转化率及页面元素点击率,分析用户行为。
情景分析法:列出各种用户使用场景,自己或多人体验不同场景下产品的使用流程,寻找依据设立数据埋点,通过数据反馈验证用户行为。

(3)数据埋点的方式
目前主流的数据埋点方式分为两种:
第一种:自己公司研发在产品中注入代码统计,并搭建起相应的后台查询。
第二种:第三方统计工具,如友盟、百度移动、魔方、App Annie、talking data等。
最后,还是要说,数据埋点是产品数据分析的基础,也是个循序渐进的过程。基础的数据分析并不难,让数据来驱动产品迭代。

作者:placeless
链接:http://www.jianshu.com/p/8c491348d2ba
來源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。