从0到1入门用户画像掌握大数据技术

市面上不少公司都在做用户画像的相关工作,无论是电商行业、金融行业、视频行业等等,都有这样的产品。那到底怎么去定义用户画像呢?OSCHINA 本期高手问答 (10 月 31 日 - 11 月 6 日) 我们请来 了嘉宾  诸葛子房老师  来和大家一起探讨关于从 0 到 1 入门用户画像掌握大数据技术的问题可讨论的问题包括但不限于:
  • 想入门用户画像需要掌握哪些技术栈?

  • 没有企业的大量用户或者行为数据,普通用户该如何真实地模拟企业级的画像项目?

  • 程序员如何入门大数据?

  • 大数据行业都有哪些职位,以及在公司中发挥的作用如何?

  • 大数据行业未来的发展如何,以 ChatGPT 为代表的 AI 浪潮是否会让大数据行业走向没落?

有其他相关问题,也欢迎大家积极提问!长按识别下方二维码立即参与提问:


嘉宾介绍

段小秋,网名:诸葛子房,先后就职于京东和 BAT,在大数据领域有多年工作经验,也是多个 Apache 项目的贡献者。蓝桥杯蓝桥云课《用户画像案例精讲》专栏作者,也是开源项目 DataCompare 作者。有奖为了鼓励踊跃提问,会在问答结束后从提问者中抽取 5 名幸运会员赠予《用户画像案例精讲》专栏电子版!

关于用户画像

用户画像概念

用户画像,即:用标签的方式去描述一个人或者一台手机、一台电脑,有些公司称之为” 用户画像 “,有一些公司称之为” 用户特征 “,其实是一个意思。举个简单的例子:袁小青,性别:女,年龄:22 岁,职业:时尚编辑,爱好:音乐、拍照,居住地:北京,消费情况:年薪 10w,喜欢的 app:抖音因此我们概念中描述的用户画像,其实是用标签的方式对于一个用户、一个账号、一部手机进行描述。

用户画像常见标签

既然上面讲到了对于用户进行标签化,那究竟要给用户打哪些标签呢?如何对标签进行分类呢?用户画像核心标签以及其分类:

用户画像的作用

1. 个性化推荐在使用一些社区产品、电商产品、短视频 app、音乐 app 的时候,经常会遇到推荐的场景,根据不同的人推荐不同的内容或者商品。这其实是用户画像其中的一个应用,根据用户查询用户的标签数据,来进行推荐用户感兴趣的内容2. 营销圈选 (短信营销、PUSH 营销)相信不少用户收到过类似的营销短信,或者一些 app 弹窗,这个也是用户画像常见的应用场景3. 策略引擎根据用户的标签展示不同页面,比如说:北京地区的用户能才能领取北京的优惠券,以及只有高消费值的用户才有淘宝上奢侈品 Luxury 入口的界面。4. 算法模型算法模型的训练,比如说:推荐模型、广告模型,需要用到画像数据来优化推荐模型。5. 画像报告不少商业公司会出一些行业报告,比如说下图的小红书、锁屏 app 的行业画像报告;还有我们经常看到的一些个人年度榜单。

大数据技术在用户画像中的实际应用

由于画像涉及到的一些行为数据,包括用户购物行为、观影行为,一些较为大型一些的公司数据日均都涉及 PB,因此需要处理的数据量非常大。在其中就会用到一些大数据的处理和存储技术,比如说:Hadoop、Spark、Hbase 等等。同时随着业务发展,一些广告和推荐场景对于实时需求也更加明显,所以实时数据处理领域,Flink、Kafka 等实时相关技术领域也越来越重要了。下面欢迎大家就用户画像和大数据技术相关问题向诸葛子房老师 提问,长按识别下方二维码/点击文末阅读原文直接回帖提问既可。


立即参与提问

相关推荐

  • 夸克 “色色”被罚50万,众多网友发帖为其求情
  • vivo发布自研操作系统蓝河 (BlueOS),系统框架采用Rust编写
  • 中方将出席英国AI安全峰会;文心一言推出会员模式;vivo发布自研蓝心大模型丨AIGC大事日报
  • 南山区最新AI发展规划出炉!三类企业成重点,每年5个超级场景项目
  • 6K Star开源简洁易用的Mac MySQL数据库管理工具
  • 使用Ray轻松进行Python分布式计算
  • 【ICCV2023】无需回放的持续学习:生成实例级提示
  • AI 人像生成再度进化!
  • 为什么我不使用 Next.js?
  • 不到 600 行代码实现了《愤怒的小鸟》翻版,GPT-4+DALL·E 3+Midjourney 撼动游戏圈!
  • 天府月报:天府科创投设立一只早期基金;国家级重点项目最高支持500万
  • 一级市场最活跃的群就是副业群
  • 新项目来咯!
  • 英伟达终于发布自家大语言模型,专攻辅助芯片设计
  • 复杂任务也不怕!上海AI Lab提出增强型LLM框架—ControlLLM,大模型可操控多模态工具
  • 吴恩达怒斥AI阴谋、Hinton自证清白!Lecun掀起图灵奖大战、哈萨比斯进行回怼!美国AI顶流圈乱象纪实…
  • PyTorch 2.1 正式发布,带来自动动态 Shape 支持和分布式训练增强
  • Meta 的无服务器平台是如何做到每天处理数万亿次函数调用的
  • 从互联网到云计算再到 AI 原生,百度智能云数据库的演进 | Q推荐
  • AIGC 是亏钱货?网易杭研是如何抓住大模型价值的