用户画像-如何构建用户画像系统
为什么需要用户画像
如果你是用户,当你使用抖音、今日头条的时候,如果平台推荐给你的内容都是你感兴趣的,能够为你节省大量搜索内容的时间。
如果你是商家,当你投放广告的时候,如果平台推送的用户都是你的潜在买家,能够使你花更少的钱,带来更大的收益。
【资料图】
这两者背后都有一项共同的技术支撑着,那就是:用户画像。本文将会从用户画像的基本概念、使用场景、构建流程和技术,为你揭秘构建用户画像的全流程。
什么是用户画像
用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具。用户画像就是与该用户相关联的数据的可视化的展现,即用户信息标签化。
用户画像可以理解成是海量数据的标签,根据用户的目标、行为和观点的差异,将他们区分为不同的类型,然后从每种类中抽取出典型特征,赋予名字、照片、一些人口统计学要素、场景等描述,形成了一个人物原型(personas).
常见的用户画像中的属性包含:人口属性、会员属性、行为属性、交易属性、消费属性。
构建用户画像数据之后,可以从各个维度、为各个行业提供个性化推荐、精准营销、智能风控等数据应用开发。
用户画像的使用场景
可以从宏观和微观两个层面来描述用户画像的使用场景。
宏观层面:构建具象认知以及战略、战术方向探索用户足迹、市场细分与用户分群,并以其为市场导向微观层面:勾画用户,联系用户需求与产品设计,便于解构场景内用户。各类数据应用:作为 推荐 / 搜索 / 风控等重要一环而存在。定性和定量化方法结合的载体,数据化运营和用户分析。精准营销和定向投放,使产品的服务对象更加聚焦、更加专注。用户画像常见的应用主要是四种场景:
用户特征洞察:
辅助用户分析和用户洞察,用户标签可以帮助业务人员快速的对用户有一个认知,然后发现里面显著的特征,获得一些商业灵感。
增强数据分析:
标签还可以丰富数据的维度。对我们的业务数据,有更深层次的对比分析,而分析洞察得到的灵感以后,可以辅助业务落地。
精细化运营:
一方面,可以将用户群体,切割成更细粒度的群组,使得运营从粗放化到精细化,用多种不同的手段,不同的渠道去触达,比如说短信、推送、邮件等等,对于用户进行驱动或召回,从而达到事半功倍的效果。
数据产品应用:
另一方面,除了驱动人工的业务以外,用户标签还可以成为其他数据产品的基础,比如个性化推荐系统,广告系统,CRM等这些系统。自动化的业务系统能更有效的利用这些用户标签,从而发挥更巨大的威力。
用户画像的构建流程
用户画像的构建,可以分为项目启动、标签发布、标签收敛、数据集成、标签拓展、用户理解、标签挖掘等过程。
项目启动阶段:确定用户画像构建的目标和使用场景。
划分标签发布阶段:设计和划分用户画像的标签,确定用户标签的计算逻辑、开发和上线的范围和迭代节奏。
标签收敛阶段:收敛标签的覆盖范围,划分出标签的重要等级和可信程度。
数据集成阶段:集成用户行为数据接入系统,计算加工成用户标签,并与用户画像服务集成。
应用拓展阶段:将固化下来的用户画像标签应用到更加广泛的应用中。
用户理解阶段:将不同应用中的用户画像标签的使用结果进行汇总,评价用户在不同应用中的使用偏好,细化对用户的画像的刻画,增强对用户的理解。
标签挖掘等过程:挖掘和扩展现有的用户标签体系。
用户画像的构建流程需要闭环,在挖掘和满足业务需求、基础数据的收集和计算、构建和完善用户画像之间迭代完善。
用户画像构建流程
在构建用户画像,设计和开发用户画像标签的过程,可以参考上图划分的步骤来开展。
用户画像构建成功之后,需要责任到人,迭代优化。
构建用户画像的技术与方法
在构建用户画像的过程中,使用分层的思想,借助平台和大数据技术接入和分析数据。上图描述了一个用户画像系统的全貌。
1.基础设施:
大数据基础设施,只是数据接入、存储、计算以及查询。
实时数据处理:通常选用 Kafka --> Flink -> 对象存储的技术。离线数据处理:通常选用 Spark + Hive on 对象存储的技术。2.数据层
包括实时流、离线统一数据、第三方数据。这里说一下离线统一数据:
以前更关注的是离线数据,但是当 APP 越来越多以后,各个端的离线数据口径和埋点是不一致的,有非常大的挑战,特别对于成熟的公司做用户画像时,会发现这一块最耗费精力,因为要对所有的数据口径进行梳理。所以这块未来希望有一套统一的离线数据来支持上层整体的用户画像应用。
3.用户理解层
在数据层上面,再会构建自己的用户理解层,基于数据去理解用户。主要包括行为和标签。
行为:因为有些行为是有强意图的,我们希望把强意图的行为也能够直接积累起来,并在上游直接应用。行为主要包括实时session行为和关键行为。实时session行为:基于session可以挖掘到上游更多的意图,还可以基于session进行线上调整,应用于精细化运营和推荐等。关键行为:需要累积好,对上游的应用或者精细化运营有非常大的应用场景。有业务需要调用时,可以直接复用这种关键行为。基于这种行为以后,我们才会去挖掘标签体系或者挖掘用户画像。标签:对于标签,主要包含了4类:事实标签:一些更偏事实类的标签,比如用户是什么等级的用户规则标签:就是通过一定的规则计算出来的标签模型标签和实时标签:通过模型挖掘的标签,以及可能服务于具体业务的实时标签。4.服务层
在用户理解的基础上,我们可以提供各种服务:统一用户画像服务、标签管理( 用标签元信息来管理标签)、用户理解平台(主要面向算法工程师和分析师,用于监控标签的质量,调优标签的结果 )。
5.应用层
各种用户画像和用户画像标签的具体应用。
上述的用户理解层,主要由产品经理、算法工程师牵头,用各种方法、算法完善用户标签体系和标签准确度。
上述的服务层,可以通过抽象出一个“标签工厂”,将用用户标签的管理和开发抽象出一个独立的项目,跨部门协作,进行开发、管理、质量监控和优化。
总结
本文从用户画像的基础概念出来,介绍了用户画像的使用场景、建设流程、涉及的技术以及如何迭代完善,描述了一个完整的构建用户画像系统的过程。用户画像系统的建设是一个庞大的跨团队项目,需要市场、运营、产品、大数据、算法各个团队的通力协作才能完成的项目。搭建好用户画像系统之后,需要验证用户标签的正确性并需要迭代完善。
相关文章导读
指标体系相关
搭建指标体系的实施过程 -- 大数据团队实践分享(https://www.toutiao.com/article/7194229231637840445/)如何搭建指标体系?OSM+ARGO+金字塔原理 (https://www.toutiao.com/article/7193851943209452070/)基于开源可视化数据探索平台 Superset 的指标体系建设(https://www.toutiao.com/article/7157336903145357824/)数据架构相关
云上流批一体架构设计与实践 - 大数据团队实践分享(https://www.toutiao.com/article/7195709449506472487/)数据治理相关
数据管理成熟度模型 Data Management Maturity Model(https://www.toutiao.com/article/7133058428549464606/)数据质量成熟度评分卡-数据管理成熟度模型系列(https://www.toutiao.com/article/7133831970345370127/)数据仓库相关
数据仓库 - 7种缓慢变化维的处理方法(https://www.toutiao.com/article/7201281170535924257/?log_from=f8eb8b86ffc15_1676762298413)开源技术相关
手把手教你源码安装 Dolphin Scheduler 作业调度系统(https://www.toutiao.com/article/7143945605298192935/)Dolphin Scheduler:从 Shell 工作流说到代码解析任务间的依赖关系(https://www.toutiao.com/article/7145296029645193765/)手把手教你源码安装 Data Ease 开源数据可视化分析工具(https://www.toutiao.com/article/7144529676512281129/)关键词: 今日头条 推荐技术 美好,一直在身边 工业设计 可视化技术 Spark
推荐阅读
航天员太空生活舱内景曝光 在太空中航天员之间是如何交流的呢?
航天员太空生活舱内景曝光,航天员在天上是如何生活的呢?中国载人航天工程空间站、神舟系列载人飞船、天舟系列货运飞船和长征系列运载火箭 【详细】
稀土镁合金简介 稀土镁合金的未来发展趋势
稀土镁合金一般指稀土元素的镁合金。镁合金是工程应用中最轻的金属结构材料,具有低密度、高比强度、高比刚度、高减震、易加工、易回收等优 【详细】
北京雾霾的原因?北京雾霾的真正原因有哪些?
北京雾霾的真正原因有哪些?每年秋冬,黄淮和华北都会被雾霾困扰。雾霾散去,我们要等新一轮冷空气南下。北京的雾霾让人看不顺眼。空气控制 【详细】
太阳能电池背上市公司 太阳能电池背上市公司有哪些?
现如今太阳能电池已经发展的越来越好了,甚至有的家庭还用上了家用的光伏发电站了。但是呢我发现大家对于太阳能电池的了解还是不是很清楚, 【详细】
世界能源危机缓解的方法 世界能源危机缓解的方法有哪些?
世界能源危机是如何产生的?世界范围内,以石油为主的能源供需严重失衡,价格飞涨,影响和冲击着全球经济发展,给世界经济发展带来巨大风险 【详细】
相关新闻
- 用户画像-如何构建用户画像系统
- 小米一卡多号专利获授权,多号共用资源节省功耗_环球看点
- 物流行业迎来“洗牌”,又一快递巨头诞生,估值200亿!
- UC,从一代浏览器王者沦落为如今UC震惊部
- LiFi将取代现有WiFi和5G技术,光天线模块将加速发展?
- 解决u盘无法格式化的问题 dos低级格式化命令如何操作?
- 主流的ArcA580规格信息 ArcA580规格简介
- 天玑920和天玑8100对比 天玑920和天玑8100哪个好?
- DNF没声音怎么解决 DNF没声音的解决方法
- 玩lol时没有声音 玩lol时没有声音解决方法
- 生命之泉部落作用?生命之泉部落有什么作用?
- 无法使用LOL观战功能 英雄联盟无法观战的解决方法
- dnf憨憨牛介绍 dnf憨憨牛宠物属性?
- 风执事加里奥多少钱大家了解吗? 推荐几款具有实用性的半价皮肤?
- dnf红眼x连发设置 dnf红眼x连发如何设置几秒合适?
- 热文:新《孔子》上映,剧本写了10年,成本花了5000万,首日票房6337元
- 高性价比的“荣耀手机”推荐,价格全面,覆盖低中高三档! 当前关注
- 屋顶为啥装个圆球?竟然这么多人不知道 当前视讯
- 手机“偷看”你的隐私?这几招可以解除
- 全球微资讯!轻松超越13900KS!AMD锐龙9 7950X3D首发评测:一半功耗、价格更低