用户行为分析基础模型的约束概述
不同于传统的BI工具,用户行为分析中的所有分析模型均是基于元数据抽象的分析模型,它底层的数据模型其实是非常简单的,即三个主体模型:用户、事件以及item,其中item只是补充作用
基础模型的特点
- 基于元数据来构建的
- 去业务的
- 有约束的
- 基于事件、用户、item模型
- 约定数据格式
- 统一用户的标识(多端的用户打通、登录前和登录后的打通)
后续的分析模型都是解决一类特定场景的问题,先定义场景,再拆解场景,最后在套用模型进行分析
主体描述:
事件:可追加,无状态的数据。用主谓宾来描述 谁在什么时候什么地点以什么方式做了一件什么事情,其5要素为:
- Who(可以抽象,不一定非得是用户,也可以是物联网设备等)
- Where(可以抽象,不一定非是地理位置)
- When
- How
- What
用户:只保留最终状态(属性归于 事件还是用户,不完全根据属性归属划分,根据属性特性划分)
Item:扩展属性的主体(比如属性字典、虚拟属性),未来也可做为其他主体的分析使用
约定的数据格式:
- 字符串(限定长度)
- 数值(限定精度和长度)
- 布尔
- 日期(支持的时间格式)
- 集合(
array<string>
)
分析模型的构成:
- 指标:基于数据类型进行抽象,所有类型支持去重数计算,数值类型可以进行算术运算
- 条件:不同数据类型支持不同的过滤操作
- 维度:不同数据类型维度处理逻辑不一样,比如数值需要定义区间,日期转换为各种粒度,数组类型是否拆分,其他类型直接分组
- 事件:元事件和虚拟事件都等于一组条件
- 算法:SQL + UDAF 完成所有分析模型的计算
分析模型:
当前抽象出来的分析模型有:
- 事件分析
- 留存分析
- 转化分析(漏斗)
- 分布分析
- 用户路径分析
- LTV
- 属性分析
- Session分析
- 归因分析
- 间隔分析
- 热图
统一用户的标识:
用户ID,登录ID,匿名ID
在数据处理过程中需要打通3者之间的联系