数据收集
数据收集大致分为网络行为数据、服务内行为数据、用户内容偏好数据、用户交易数据这四类。
还得一提的是,储存用户行为数据时最好同时储存发生该行为的场景,以便更好地进行数据分析。
行为建模
该阶段是处理收集到的数据,注重大概率事件,通过数学算法模型尽可能地排除用户的偶然行为,进行行为建模,抽象出用户的标签。
这时也要用到机器学习预测用户的行为偏好。好比一个 y=kx+b 的算法,X 代表已知信息(即用户标签),Y 是用户偏好,通过不断的精确 k 和 b 来精确 Y。
在这个阶段,需要用到很多模型给用户贴标签。
用户画像基本成型
该阶段可以说是第各二阶段的深入,把用户的基本属性(年龄、性别、地域)、购买能力、行为特征、兴趣爱好、心理特征和社交网络等大致地标签化。
为什么说是基本成型?因为用户画像永远也无法100%地描述一个人,只能做到不断地去逼近。因此,用户画像既应根据变化的基础数据不断修正,又要根据已知数据来抽象出新的标签使用户画像越来越立体。
一般采用多级标签、多级分类进行“标签化”,比如第一级标签是基本信息(姓名、性别),第二级是消费习惯、用户行为;第一级分类有人口属性,人口属性又有基本信息、地理位置等二级分类,地理位置又分工作地址和家庭地址的三级分类。
数据可视化分析
在此步骤中,开始利用前面产生的用户画像。一般是分析特定群体,比如可以根据用户价值来细分出核心用户、评估某一群体的潜在价值空间,以作出针对性的运营等。如图: