用户行为分析中的Events数据模型概述

用户行为分析中的Events数据模型概述

用户行为分析基础模型的约束概述

不同于传统的BI工具,用户行为分析中的所有分析模型均是基于元数据抽象的分析模型,它底层的数据模型其实是非常简单的,即三个主体模型:用户、事件以及item,其中item只是补充作用

基础模型的特点

  1. 基于元数据来构建的
  2. 去业务的
  3. 有约束的
    1. 基于事件、用户、item模型
    2. 约定数据格式
  4. 统一用户的标识(多端的用户打通、登录前和登录后的打通)

后续的分析模型都是解决一类特定场景的问题,先定义场景,再拆解场景,最后在套用模型进行分析

主体描述:

事件:可追加,无状态的数据。用主谓宾来描述 谁在什么时候什么地点以什么方式做了一件什么事情,其5要素为:

  1. Who(可以抽象,不一定非得是用户,也可以是物联网设备等)
  2. Where(可以抽象,不一定非是地理位置)
  3. When
  4. How
  5. What

用户:只保留最终状态(属性归于 事件还是用户,不完全根据属性归属划分,根据属性特性划分)

Item:扩展属性的主体(比如属性字典、虚拟属性),未来也可做为其他主体的分析使用

约定的数据格式:

  1. 字符串(限定长度)
  2. 数值(限定精度和长度)
  3. 布尔
  4. 日期(支持的时间格式)
  5. 集合(array<string>)

分析模型的构成:

  1. 指标:基于数据类型进行抽象,所有类型支持去重数计算,数值类型可以进行算术运算
  2. 条件:不同数据类型支持不同的过滤操作
  3. 维度:不同数据类型维度处理逻辑不一样,比如数值需要定义区间,日期转换为各种粒度,数组类型是否拆分,其他类型直接分组
  4. 事件:元事件和虚拟事件都等于一组条件
  5. 算法:SQL + UDAF 完成所有分析模型的计算

分析模型:

当前抽象出来的分析模型有:

  1. 事件分析
  2. 留存分析
  3. 转化分析(漏斗)
  4. 分布分析
  5. 用户路径分析
  6. LTV
  7. 属性分析
  8. Session分析
  9. 归因分析
  10. 间隔分析
  11. 热图

统一用户的标识:

用户ID,登录ID,匿名ID

在数据处理过程中需要打通3者之间的联系


Comments

Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×