赞助商
立即赞助

如何找到你的细分目标用户?试试这个决策树!

产品设计3年前 (2021)发布 流光
1.8K 0 0

我们常用的细分用户方式聚类分析。但如果针对某一关键指标,找到这指标差异的细分人群,可以试试用决策树来细分户。

近的项目中,业务方提到了一问题:因内的曝光少,很好的基础数据作推荐算法输入,希望通过调研指导内投的冷启动,知道给哪些特征的用户投哪些内。

针这个问题如是单单分析个特征结,可能会把些要属性组合淹没在了特定群。比如举个不真实例子,如用户买美妆品为进分析,看男女数据分析,我们会发现相比于女性,男性几乎是不买美妆品。是如针性进步拆分年龄,我们会发现 95 后男性也有较高美妆买为,如看性分析这个美妆有高需求特殊男性群会被忽视。

如何找到你的细分目标用户?试试这个决策树!

是可以分析用户属性很多,如手动组合分析常不便。这个时候可以用决策树分析来解决这个问题。

什么是决策树?

决策树是细分用户。不于聚类细分用户,决策树细分用户有个目标变量概念。决策树细分目是过逐层划分不解释变量值获多属性组合细分群,使细分群在目标变量上表现区隔度尽可能大。

解释变量就是用户征,比如人学、消费征、用户行为数据等。

目标变量则是我们研中关心的核心指标。它有两种类型,分别服务两种不同目的。

  • 描述目的:在市调研中目标变量一是二变量。比如在上述问题需求中,就是用户对某个内容是否偏好,通过决策树可以知道有哪些征组的用户群体对产品偏好度高,哪些更低。
  • 预测目的:种情况下目标变量是类别变量。比目标变量有四个值,分别代表 A\B\C\D 四个品牌,通决策树以道哪特征组合的人群更偏哪个品牌,以输出判别的规则为预测模型。

决策树的原理是什么?

决策树算法 CHAID 和 exhaustive CHAID 在结简洁度和区隔度上表现都更好是最常用算法。而 exhaustive CHAID 与 CHAID 区在于计算了更多组合情况,可能获更好分割,本质上两者计算是统。此本以 CHAID 为例进具体介绍。

CHAID 算法称卡方动交互检测法。顾名思义,CHAID 就是动对解释变量和目标变量进行交叉析并进行卡方检验,通过比较卡方检验显著性程度来寻找最佳细维度。然后在此基础上继续细直卡方不再显著或达数生成的条件限制。最终输出的树如下图 1。

输出的决策树结果向我们传达两个重要的信息:

  • 树结构组情况:从结果图上可以某个节点会根据解释变量不同的取值细为多个节点。该节点叫做父节点,节点叫做节点。父节点和节点构成了决策树的结构。如果不再向下继续划,则节点称为最终节点,即最后的组。最后组的属性即为达这个最终节点的所有节点属性交集
  • 目标变量分:每一个节点显示目标变量分。比下图中的节点一就表示一市的用户中 73.5%对个权益感兴趣。

如何找到你的细分目标用户?试试这个决策树!

△ 图 1 决策树结示意

有的候决策树会过于庞大复杂,可以通过置树的层数、父节点、节点最本数来修剪决策树:如果决策树达树最大层限制则不往下细;如果节点本达不父节点数量要求则不往下继续割;如果节点本数达不个节点的数量要求即其它节点并。

但是果从决策树图中找哪最终分组是对目标变量更感兴趣的比费劲。所以决策树除输出决策树图之外还以输出目标类别收益表(比内容偏中将有偏设为目标类别,示意见图 2),收益表包含 4 个数:

  • 节点:指的是组在节点中的百比
  • 增益(收益):指的是分组目标类别样在整目标类别样中的占比
  • 响应:该节点中答目标类别的人占该分组的例
  • 指数:增益/节点*100%,如果超过 100%明该分组对目标类别的偏好高于平均

如何找到你的细分目标用户?试试这个决策树!

△ 图 2 收益表示意

收益表将对目标类别偏好从低到进行列,很快到哪些最终节点分组对目标类别偏好。如上图就显示节点 5 是对目标变量最感兴趣的人群。同时因为收益表还包含了节点百分,可知道这些分组在整体场中的大小,于判断可将哪些分组包含进来扩大目标人群范围。如上图中虽然节点 5 是目标变量最感兴趣的群体,但人数较,在整体场中只占到 7.1%。我们可将节点 5、16、1、12 都作为目标群体,将场覆盖率到 37%。

SPSS 中如何操作?

1. 描述目的下何操

  • 数据准备:代表个用户样本,数据括目标变量和所有解释变量。
  • 选择决策树:spss 析à类à树
  • 输变量:将目标标量(用户对内容偏:偏-不偏)输到因变量中,释变量(用户属)输到自因变量中。因变量下方还有一个分类对框,在其中将目标变量的偏勾选为目标值,该操以用在续输出收益分析表。
  • 择建树方式(增长方式):默认择 CHAID
  • 条件:可设置树的层级、父节点子节点的小样本数
  • 输出:输出统计量里可以选择输出收益表和收益图

如何找到你的细分目标用户?试试这个决策树!

△ 图 3 描述目的决策树面操作说明

2. 预测目的如何操作

如果是预测目的,前期计算设定操作与描述目的一致,但是还有模险估计和预测

  • 验证:果是描述目的下,不需要进行个步骤操。果是预测目的下,选择进行叉验证。SPSS 将样分为个样组分别进行决策树计并出风险均值为整风险值。
  • 保存:在保存按钮中可择输预测值和预测概率。预测概率会输每个户在因变量各个取值上的预测概率,预测值会输该户在因变量是预测概率最大的值。

如何找到你的细分目标用户?试试这个决策树!

△ 图 4 预测目的下验证和保存预测变量操作

决策树的应用与局限

如果析的目的就是希望能找在目标指标上尽量差异显的细人群,决策树是一种不错的方式。如果是以聚类的方式细,可以将目标指标作为其中一个细输入变量,但是因为聚类是为了让用户在空间的距离尽可能远,目标指标可能并不是最重要的响因素,所以最终的结果可能目标指标上用户并不显。而决策树的目的就是尽量在目标变量上拉开差距,所以细结果上差异会更加显。所以决策树经常被运用在市产品、品牌来定位最核心的目标人群征上。别适一开始业方提出来的业问题:定内容应该给哪些用户投放更加适。

但是决策树也有其局和问题。

  • 相比聚类细,决策树只能定一个目标指标。如果希望在个指标上找差异性较大的用户就需要用聚类析来实现。
  • 无法控分组数量,非常容易细分出几组甚至更的分组。分组数量增加描述和理成增加。在市场人群细分和定位问题中我们不关心所有的分组,只关心最重要的几组,所以分组不带来问题。而果需要对整个目标用户进行细和理解,聚类能控制类数量,是更加适的方法。

欢迎关注「JellyDesign」小程序:

如何找到你的细分目标用户?试试这个决策树!

© 版权声明
您必须登录才能参与评论!
立即登录
暂无评论...

相关文章

当你需要关于自己产品的用户体验数据时,然而,你却不知道从哪里获取?那么首先,你需要选择正确的研究方法。接下来,我们来...
用户研究
编者按:为什么做用户调研时说喜欢用这个产品的人,实际上往往都不怎么用?该如何与用户交流才是最有效的?本文列举了常见的...
用户研究
序言 对于当下的互联网产品,无论是主流或非主流,处处都能看到推荐系统的应用场景。比如,当你在淘宝下单购买了一台iPhone 1...
推荐系统
当我们谈及「用户」和「受众」的时候,提到最多的词大概是「现在的年轻人」,而这个词在很多时候会被置换为「00后」、「05后...
Z世代
本篇重点聚焦到新手访谈常见的问题上,将个人实践后觉得切实有效的方法梳理出来,希望为新手访谈者提供应对问题的思路和策略...
用户研究
人物角色这个东西,理论上还是很有用的。可以辅助产品定位,避免了在规划产品时,把所有人对需求都混为一谈: 很多人对人...
人物角色
问对问题才能找对答案,这个逻辑并不复杂,但是在做产品设计的时候,要做到并不是那么容易的事情。如何提问,对于最终产品的...
Eugen Eşanu
文章是关于设计研究中的定性与定量研究方法、步骤,用户访谈的一些思考。 一、设计研究的方法 现在关于用户研究的书特别多,...
交互设计