5个步骤 ,学懂PC站和H5站数据埋点

作者: 少校seo 分类: 黑帽seo资讯 发布时间: 2019-09-13 06:09

本文抛开数据增长法和嵌入点技术的原理,从0-1开始,由每个人手动完成嵌入点。学习如何迈出第一步需要10分钟。

一年前,我写了一篇题为“学习应用客户端数据嵌入点的7个步骤”的文章,在网上获得了10w+的阅读量,帮助许多新来者快速完成嵌入点。从那以后,就有学生的反馈和咨询。除了联系和负责APP客户的产品外,大量学生还负责个人电脑网站和H5站的产品。

那么如何快速修复个人电脑网站和H5站的产品埋葬点呢?

如果你遇到以下问题,我们会继续往下看,跟着我。

领导说我们的个人电脑和H5网站需要更多的统计数据,你负责处理。R&D说,我们的个人电脑网站使用哪一个数据统计系统?您已经选择注册。R&D说你可以把我们H5网站的统计代码发给我,并给我发一封关于统计要求的邮件。运营部说,我们的个人电脑网站能看到什么数据?站台在哪里?我如何检查首页上的紫外线光伏?运营部表示,我们的网站希望做搜索引擎优化搜索引擎,并希望看到网站嵌入js的每日来源和关键词,发送给我。

本文抛开了数据增长和嵌入技术的原理,由每个人手动完成0-1的数据嵌入。我们花10分钟学习如何迈出第一步。

我们将分五个部分进行讨论:

首先,什么是数据嵌入点

第二,网页嵌入网站与应用程序嵌入网站的区别

什么是知识产权光伏紫外线饼干?

四、PC机站和H5站从0-1完成埋葬点

五、埋葬点后去哪里看数字,能看到什么数据

隐藏点是网站、应用程序和其他产品日常改进和数据分析的数据收集基础。我们主要用于收集用户行为数据(如页面访问路径,点击哪个按钮)进行数据分析,使操作同学更合理地安排操作计划,使产品经理更好地优化产品路径。目前,市场上有很多第三方嵌入式服务提供商,如百度统计、优盟、growingIO等。

当一个网站上线时,开发者不仅要保证网站正常运行和体验良好,还要做好数据收集的重要工作——收集用户行为数据有助于了解网站功能是否满足用户需求,分流方法是否有效,上线后新功能的效果是否达到最初的设计意图。根据数据指南有效优化产品体验和发现新产品方向是产品经理的基本技能,而如何收集准确和充足的网站数据应是开发人员的责任。

目前常用的数据嵌入方法:

(1)手动埋葬点

手动代码嵌入点很常见,需要调用嵌入点的业务方调用需要收集数据的嵌入点方法。

(2)可视埋葬点

然而,埋葬地点是近年来埋葬地点的趋势,许多大型工厂自己的数据埋葬地点也开始这样做。优点是业务端的工作量较小,缺点是技术推广和实现有点困难(业务端前端代码规范是一个大前提)。

阿里的许多活动页面是通过可视界面拖放配置来操作的,并且这些活动控制元素是唯一标识的。通过配置隐藏点的背景并将元素与要收集的事件相关联,可以自动生成隐藏点代码并将其嵌入页面。

(3)没有埋葬点

没有隐藏点是前端自动收集所有事件,报告隐藏点数据,后端过滤并计算有用的数据。优点是前端只需要加载嵌入式脚本,缺点是流量和收集的数据太大,服务器性能压力很大。主流增长就是这样一个实施方案。

目前,我们自己的网站仍然是第一个。最近几年出现了后两种形式,数据的准确性和流行性仍需验证,所以今天我们将讨论最常见的埋点形式。

如今,大家越来越关注APP的产品设计,所以APP的数据分析也越来越多,但网站也需要数据分析和嵌入。目前,H5非常受欢迎。许多公司使用H5网页的形式来承载他们的产品。从技术原理来看,H5的网站仍然是用超文本标记语言编写的。因此,嵌入式站点的实现方法不同于APP。

简而言之,如果你想看数字,先把它们埋了。首先,通过数据统计系统获取统计代码或代码包,然后将其添加到您的页面代码或集成到APP代码包中,然后您可以看到相应的用户行为数据。

知乎客户端埋点流程、模型和平台技术

作为商业智能和人工智能系统的重要组成部分,嵌入式网站是企业提高产品工程质量、实施自动测试、提供个性化推荐服务的重要数据源。在传统的纯网页和本土产品中,嵌入点从技术角度来看可能并不深刻,但从商业角度来看,很难达到嵌入点设计规范、高流程效率和质量保证。本文主要研究智虎客户端的嵌入式点模型、流程和平台技术。

为什么很难埋葬客户?

随着新代码上线,网络端的嵌入点可以立即生效,版本的出发点相对较弱。即使嵌入点错误,修复成本也较低。

对于客户端来说,如果使用本机技术开发的嵌入式功能有问题,它需要等待下一个版本来修复,并且还有版本覆盖的问题。修复埋藏地点的时间窗口通常相对较长,这将对业务产品的快速迭代产生非常负面的影响。从业务的角度来看,在客户端发布功能之前,它可能不会完全考虑要进行的数据分析,也没有收集大量隐藏点的计划,这对隐藏点设计者、客户端开发人员和测试人员来说是一个巨大的工作量。另一方面,如果真的需要几个小时才能发现重要的埋藏点还没有被收集,那么到时候仇恨就会减少。因此,如何在一个版本中全面规划要收集的埋葬地点也是一个具有挑战性的问题,有一种“守兵一千天,战一会儿”的感觉。

埋葬地点的过程

从业务流程中收集隐藏点是数据驱动型公司的必要条件。智虎的产品功能评审不仅包括产品需求文档,还包括相应的DRD(数据需求文档)。对于掩埋场,DRD需要澄清业务目标和掩埋场缺口之间的关系以及需求的优先级。对掩埋网站的大部分需求来自DRD,整个过程涉及黑帽seo的多个角色,主要包括产品经理、业务数据经理、开发工程师和测试工程师。

目前,智湖的埋葬过程如下图所示。

回顾智虎埋葬过程的迭代历史,整个过程落地三部曲可以概括为六个字:能力、意愿和工具。

能力

近年来,智虎的业务发展迅速,嵌入网站的过程经历了多次迭代。在数据平台组建立之初,开发了全端嵌入式点SDK和日志接收服务。随着嵌入式软件开发工具包的推出,数据平台集团开始在公司推广嵌入式网站。早期,正是嵌入式网站的推广者和设计者,使得公司基本上具备了管理能力。

打算

为了快速推进业务的埋点,数据平台集团聘请了埋点设计师来设计整个公司的管理。这种方法有助于公司的嵌入工作在短时间内顺利进行,但随着业务的不断增长,即使是资深的嵌入设计师也无法快速响应业务的嵌入需求,跨业务任务调度也给业务带来更多麻烦。我们发现,如果掩埋过程是闭环的,它可以使整个过程更加高效和平滑。企业中哪个角色更愿意设计嵌入点是流程效率的一个重要因素。以下是业务的几个数据相关角色的主要工作内容:

●数据分析师和产品经理主要是数据的用户。他们的工作是发现和解决业务问题,并不断迭代产品。

●工程师最了解代码的细节和时间,但数据的具体用途不是很清楚。

●数据仓库接口人员负责业务数据的生成,并与数据仓库团队进行接口。埋藏点的定义需要深入理解。

在考虑了各种角色的意愿后,我们设计了“业务数据经理”的角色,负责整个业务的数据生产,主要负责业务数据仓库需求和嵌入式站点的设计。

工具

早期嵌入式点测试只有一个能力有限的小工具,用户体验不够好。直接使用嵌入式点测试作为客户端发布过程的一部分只会降低测试工程师作为一个整体的效率。客户端发布经常会遇到新嵌入点打字过多、打字错误、漏打、旧嵌入点缺乏回归测试等问题,给企业带来很多麻烦。因此,一个易用、自动化、智能化的嵌入式测试平台成为当时的当务之急。在开发了一套完整的嵌入式点管理和测试系统后,测试工程师将嵌入式点添加到客户端发布过程中,并对整个公司的嵌入式点进行了全面的审核,促进了业务发展,改善了嵌入式点的元信息,并为核心嵌入式点创建了回归测试。埋设点测试平台有效使用后,埋设点的质量较以前有了很大提高。

#p#分页标题#e#

埋藏点模型

俗话说,“如果一个大国要靠烹饪小美味来统治”。目前,智湖的埋地数量约为3000处。如果没有统一的标准化模型,每个人都会设计不同的掩埋场。为此,数据平台在公司级别提供了一个公共的隐藏点模型,这需要公司级别的规范和个性化的业务需求。

技术上,我们使用协议缓冲区来管理隐藏点模式,统一隐藏点字段和枚举类型值,并统一SDK版本。

页面浏览

网页浏览的统计,对于网站来说,因为网址非常清晰,统计规则简单而新鲜。一般来说,某一类网页的点击率可以通过根据一定的规则对网址进行分类来计算。

对于客户端,统计方法类似于网络端。由于客户端没有像网站一样自然的网址,它需要为页面伪造一个网址。只要能够定义网址,如果网址发生变化,就可以计算出一个新的现值。

在客户端页面浏览的统计中,我们遇到的最困难的问题是:什么是页面?如果一次页面跳转是一次新的曝光,问题是页面功能的多少变化被算作一次页面跳转?一个典型的场景是,当页面中的子模块在选项卡之间切换时,如何计算当前页面的PV。目前智虎在这个问题上还没有做任何统一,业务将会对其进行定义。

行为事件

对于行为事件,智虎选择了事件模型来全面描述谁、何时、何地、如何和什么。

谁、何时和如何

谁:用户和设备的身份特征。

何时:触发埋葬点的时间。

如何:当埋葬点出现时,用户的当前状态,如网络是4G还是Wifi,当前的AB实验命中等。

在模型中,在大多数情况下,嵌入软件开发工具包自动生成谁、何时和如何生成,嵌入人员不需要关心这三个要素。

在哪里

准确定位事件的位置。它主要包括以下字段,以提供埋点设计器来定位用户事件。

{

可选日志类型类型= 1;//日志类型

option alint 32 id = 2;//由埋点管理平台生成,功能类似于大家常用的event_name。

option alstring URL = 3;//当前页面url

重复模块模块= 4;//位置所在的模块、模块之间的嵌套以及模块在父模块中的位置。

}

什么

事件发生地点的内容信息,这里收集的内容由企业决定。例如,单击的卡是答案还是实况,以及内容的当前状态。

对于为业务定制的“什么”,最初我们为个性化需求的特定字段设计了一个公共内容信息和一个数据结构。

messageBusinessInfo {

选项内容内容= 3;

选项optionalPlayInfoplay = 16

选项搜索= 4;

//电子书阅读

optionalReadInforead = 22

}

就什么而言,我们在客户开发中主要遇到以下问题:

●收集所需数据有时与客户的功能开发无关,这使得客户很难获得数据。

●当数据结构更复杂时,客户端的工作量会增加

●如果打字错误和漏打,需要发行版本,周期长

面对上述打点,对于不一定由客户端获取的数据,协议缓冲区(Protocol Buffers)结构被改变为由服务后端生成,序列化为字符串,并通过api带回给客户端,客户端只需要将字符串放在一个公共位置即可。数据平台组的统一实时ETL程序对结构进行反序列化,如下图所示。

至于什么,目前在埋地设计中遇到了以下问题:

●埋藏的钥匙越来越多。字段和服务不在系统级别绑定。有些字段使用多种服务。枚举值不断增加,给埋点设计者带来更多的信息噪声。

●业务依赖于其他业务的管理。嵌入点的变化可能会影响其他业务的核心指标。

#p#分页标题#e#

第一个问题是,我们正在管理隐藏点字段,并在系统级别改进平台公共字段和业务字段的元信息。第二个问题,我们仍在探索。如果你在这方面有良好的实践经验,请与评论分享你的知识。

埋设点管理平台的平台技术

当公司的规模生态仍然很小时,使用电子表格或维基管理掩埋场对掩埋场的使用几乎没有影响。当公司的业务发展迅速时,从一种产品到多种产品,从几十个埋藏地点到几千个埋藏地点,为了准确地使用埋藏地点,有必要开发一个埋藏地点管理平台。

埋设点管理平台负责管理埋设点的元信息,解决了埋设点输入和搜索的需要,简化了客户端埋设点的内容。这是智湖埋藏点过程的重要组成部分。同时,它还为埋设点测试平台和数据采集系统提供了元信息接口。

检查埋葬点

支持根据多个标签查找和过滤掩埋点。当创建埋葬地点时,输入这些元信息需要时间,从长远来看,收益将非常大。

创建掩埋点

创建埋设点时,填写埋设点对应的业务元信息和技术元信息,包括埋设点对应的测试指令。

埋设点管理平台提供埋设点的密钥,如果需要新密钥,可以应用于该平台。对于枚举类型值,系统将自动完成。

生成埋设点设计文件

埋设点设计文件是工程师开发埋设点的基础,也是埋设点过程中沟通的重要“媒介”。埋设点文件规范了埋设点的设计,并包含以下埋设点信息:

掩埋场的基本信息:业务、等级、应用、使用说明、管理时间、测试说明、要求文件等。

隐藏点的角色:数据所有者、开发、质量保证

对应于掩埋点的字段和字段值

用于提供埋藏点元信息的应用编程接口

数据收集服务将把收集到的埋藏点写入卡夫卡。对于每项服务的实时数据消费需求,我们为每项服务提供单独的卡夫卡。流量分配模块将周期性地读取由掩埋点管理平台提供的元信息,并将流量实时发送到每个服务卡夫卡。

埋设点测试平台

埋藏点的质量是数据的生命线。一旦出现问题,整个大数据链路的数据值将受到影响。隐点异常不仅影响决策,而且消耗大量的能量和时间来修复数据。最直接的后果是,尽管数据量在增加,但数据本身无法得到有效利用。

智湖的数据团队在2016年制作了一个嵌入点的小工具。只要输入测试设备的id,就可以查看相应的嵌入点信息。该工具主要有以下难点:

●埋藏的原木数量很大,因此通常很难找到要测试的埋藏地点。

●显示整个日志,系统无法确定埋葬点是否准确,这取决于肉眼。

●无法创建测试用例和回归测试

●埋点缺失或错误,仍可通过人工找到,但发送方很难找到重复的埋点。

面对上述问题,我们重新设计了埋点测试平台,目标是使埋点测试更加自动化和智能化,主要有以下功能:

●可以创建埋设点测试用例,打开埋设点管理平台,支持埋设点多条件选择

●支持埋点测试用例的启动,只显示埋点测试用例中的埋点,并单独显示冗余信息

●自动提示埋藏点的错误、遗漏和重敲,突出前端接口,生成测试报告

●支持手机代码扫描,无需输入设备标识即可连接到系统

其他:关于混合型埋葬点

客户端中的H5生成嵌入点使用了JavaScript SDK。如果直接发送到日志收集服务,客户端的重要属性将丢失。智虎的方法是将H5日志发送给客户端,客户端将对其进行处理并将其发送给日志接收服务。在智湖,我们称H5为混血儿。我们自己开发了一个混合框架。框架支持跨终端通信和埋点传输,自动解决ZA(智湖分析日志服务器)的通信问题。

混合框架主要解决以下问题:

●对于混合了本机和JS的页面,页面暴露统计

●JS页面内跳转的页面暴露统计

jssdk生成的日志被传输到本机并发送到日志收集服务

●对UTM系列跟踪链的跨本地和JS支持

摘要

当今大数据的快速发展趋势对许多公司来说是一个挑战。埋藏点是整个数据链的起点,也是数据生命的源泉。随着智虎业务的快速发展和越来越多的业务,智虎的嵌入式点模型、流程和平台技术正在经历不断的迭代,在应用实践中还有很大的改进空间。欢迎对数据开发感兴趣的朋友加入我们。有关详细信息,请参见:门户高级门户

团队简介

智虎的大数据平台团队,隶属于智虎的技术中心,是拥有数据驱动基因的公司在发展到一定阶段时会关注的团队。面对多样化的业务发展和精细化的运营,对数据的需求变得越来越嵌入式测试工具。大数据平台团队主要负责:

●建立公司级视觉分析系统和数据服务

●维护完整的数据收集、集成和数据仓库,以及与业务系统的接口

●管理数据生命周期,并为数据开发、元信息管理和任务调度提供一站式平台

●提供实验室测试实验平台,系统整合实验分析框架,促进业务增长