如何做有意义的消费者人群分类和用户画像-2

分享

上个月老中医在持续50多天的便秘中好不容易憋出了一篇关于消费者人群分类和用户画像的文章,结果很多反馈感觉没写完,于是本坐只能“2”了。提前预告一下,本文最后一段有彩蛋。


确实,几乎所有关于市场研究的工作都与消费者人群分类和用户画像有关。自从把那个文章发出去以后,我就越来越坚信,大家普遍对这个问题感到困惑也是肯定的。而作为老中医的重要职责之一就是继续增加大家的疑惑,所以我们还得写一个续集。

上一篇我们讲的还都是传统调研下如何获得用户分类和画像的问题,现在我们讲讲大数据下这个问题是否能找到新的途径?与以往推崇大数据不同,今天老中医要和大数据唱唱反调了。

大数据改变了什么?


理论上,大数据改变了数据的采集、汇集和处理模式,让以前我们无法分析的,价值密度过低的数据变得可分析。正是因为这种变化,我们每个人都面临空前的隐私泄露风险。无论如何你都要使用手机,而只要你拥有一部自己的手机,就意味着你需要实名申请一个号码。这样你的身份证号、性别、年龄、籍贯等重要信息就已经进入基础运营商的数据库里了。而当你真的经常使用这个手机以后,你每天出现在哪里,去什么地方出差、旅游,与谁通过电话,用手机的4G网络访问过哪些网站都会被基础运营商全面掌控。甚至分析人士也可以通过你手机在夜间停留的位置推测你的家庭住址,再结合地理位置信息加楼盘信息,推测你这个房产的价值,这样就可以大致估算你的经济能力……

上面所说的这一切还仅仅是建立在非常粗线条的信息基础之上的,或者说只要你想融入现代生活,泄露隐私已经成为你必须付出的代价。当然老中医自己倒不是特别在意这些信息是否会被别人监听,毕竟我们不过是这个时代的普通人,任何商业机构拿一两个个体做隐私分析其实并无太大意义。老中医想要说明的是:大数据时代每个消费者都是透明的。

既然是透明的,就意味着对于商家而言最幸福的一个时代已经来临。我们不仅有机会全面观察到每一个自己的用户,了解他们是谁、在哪、他们有什么爱好,更有机会了解竞争对手用户的类似数据。当然对于一部分商家最好的时代也意味着对于另一部分商家最坏的时代。因为大家都有机会获得完整信息了,接下来对比的就是谁更会解读这些数据,以及谁更能基于这些数据做出最恰当的判断和行动。对于所有商家而言,这同样是一个机会均等的游戏。

大数据洞察用户的风险在哪?


每个消费者都是透明的,却并不意味着你能真正理解这些消费者。在使用这些数据的过程中,往往有非常多的风险和悖论,应当说时至今日大数据也仅仅才是一个开始而已,还有大量内容需要试错和积累经验。接下来老中医就分享一些这方面的体会。

第一种风险:样本数量依赖。这是一种非常常见的错误,大数据之所以“大”,在很多人眼里是因为数据多了,样本量大了。所以大家在使用数据的时候特别在乎有多少样本,似乎越多越好。这种想法容易让决策者忘了自己销售的产品是什么。就拿老中医天天研究的汽车市场举例,时至今日中国的汽车用户不过是人口基数的10%多一些而已,如果有人拿出一个5亿样本的数据库过来,那就意味着里面绝大多数声音不是发自车主那里。前些年很多拿所谓“互联网思维“说事的人有一句口头禅叫”得屌丝者得天下“,其实屌丝最多只是能帮你拿到更多的声音份额而已,这个世界最终是由1%的精英决定的,或者即便按照二八法则,也是由前20%的准精英决定的。

第二种风险:只看相关性,不看因果关系。这个判断来自大数据领域圣经级的著作《大数据时代》,起初老中医也被这个论断忽悠过。但时至今日,我越来越感觉到知其然而不知其所以然的巨大风险。即便在大数据时代,你看到了强烈的相关关系,也必须要努力去探寻相关关系背后是否存在因果关系的内在机理,只有这样你的分析才算是可靠的。

比如以下几个现象是可以通过汽车数据工场的数据系统被发现的:

1、 很多小众车型,他的用户满意度是非常高的,而且比那些卖得好的神车满意度高很多。是否可以说明车卖得量越大,用户满意度越低?

2、 同一款车,上市初期的用户满意度是最高的,而后随着上市时间的延长,用户满意度会持续下降。但我们在一些特定的细分市场也观测到一些相反的指标,比如迈腾用户关于舒适性的满意度,在2010~2015年的几年间反而上升了。能否说明用户对舒适性的要求下降了?

3、 买比亚迪的用户往往也会钟情于小米手机,是否能够说明迪粉和米粉之间存在某种联系?

应当说在老中医看来,上面三个案例都很难下简单的结论。若要给厂家提供准确的建议,就必须做非常小心的求证。针对第一个例子,的确像DS这类小众品牌,用户满意度是超高的,那是因为他只能抓住强烈喜欢这个品牌的极少数群体,这种满意度不具备可推广性。而那些神车,虽然在平均值上的满意度表现一般,但产品吸附用户的能力极强,所以他们才能获得如今的江湖地位。而第二个例子,迈腾舒适性的满意度之所以上升了,只是因为如今买迈腾的人和四五年以前不再是同一个群体了,他们对车辆的使用经历、基本需求都是不同的,看不到用户群本身的变化,也就无法理解这种相关性背后真正的含义。至于迪粉和米粉的问题,他们背后极有可能包含更多的信息,比如预算、价值观,或者两个品牌在某个时段的卖点包装方式偶尔重合了(比如比亚迪经常炒作自己的某几项参数,而小米也经常拉着大家去“跑分”)。

第三种风险:简单现象推理。比如本文前面说的,要推测一个消费者的经济能力,我们可以通过分析他住在哪里(基于手机基站定位),然后结合搜房网的地图和楼盘数据库,判断他所在这个小区的房价。比如他住在星河湾或者龙湖地产的某个别墅区里,他理应是一个富人,虽然他可能仅仅是一个住在那里的保姆。当然这种判断如果再结合一些其他信息应该还是可以做到很高准确率的,比如这个人经常飞来飞去,而且出差过程中晚间停留的位置通常是高档酒店。

接下来老中医再多抛出一个话题,恐怕就不那么容易判断了。比如我们拿淘宝网或者京东的消费数据做分析。A用户在淘宝网上买过海外代购的奢侈品,B用户在淘宝网上的消费记录基本都是一些杂七杂八的小东西。那么A、B两个用户究竟谁的消费能力更强?

直觉逻辑会告诉你,A买了奢侈品,他应该是财力更为雄厚的人。事实真的如此吗?

如果我们分析A之所以在淘宝上买奢侈品的原因,可能有以下几种:

1、 为了便宜,因为海外代购比国内的流通渠道价格低30%~50%

2、 因为国内没有这个款式,而A近期又没有去巴黎或者米兰的计划,身边的朋友也没有类似计划

3、 用户很了解这个海外代购的经营者,他确实售卖的都是货真价实的东西

如果这样细分下来,你可能会看到更多的东西。而现实中还存在另一种可能,就是很多人明明知道淘宝代购的所谓奢侈品,很多其实是A货。比如买一个最俗最俗的路易威登手袋,新光天地的价格是8000,淘宝代购是5000,而动物园批发市场是400。如果去买这个400元的,虽然价格低了95%,但可以100%肯定这是假的。而在淘宝上找一个代购,可能会获得一种“大概是真的”这种心理暗示,反正名牌手袋这种东西,真的假的其实用起来都是一个德行。大概就是这种心态驱动了很多人选择网购可能是真的,但更大可能是假的奢侈品。如果考虑到这些,你还能判断A和B谁更有消费能力吗?

上面列了三种可能的例子,想要说明的问题是,虽然数据都在这里了,但他未必像你表面看到的那样确定无疑。未来的大数据研究将是一门试错科学,同样需要足够长时间的探索、尝试和积累。当然这并不意味着大数据不可用,显然他已经远远超过传统研究模式,关键是数据应用者必须具备足够的洞察力和判断力。

未来可能的方向如何?


回到人群画像这个话题上来,老中医这里其实没有关于如何做人群画像的确切答案,正如文章开头所说的,写这篇文章的目的是为了继续增强大家的疑惑。不过我还是可以随便瞎猜一下未来可能的方向。

首先,传统描述人群的维度需要被替代或补充。因为大数据不是主动去问每个用户对某个问题的看法,而是听用户自己如何说,看用户自己如何做。所以在人群描述维度上,除了人口特征因素以外那些内容,更多是基于行为进行追踪的。这就像上一篇文章提到的那样,看美剧的人和看抗日神剧的人应该是有很大差别的,只不过这种差别恐怕还要辅助更多的维度加以强化。

其次,描述人群的维度可以加入时间轴,而不是像传统研究那样大多数只能局限在某个时间切片上。比如微信或者淘宝,他们经常推出一些新花样,帮助你回顾过去几年在这里的成长史。这其实也是一种非常有意义的描述方式,当然这同样需要大量的创新模型。

第三,融入了时间轴,人群描述就会更加具有预测性。因为在绝大多数预测理论中,未来都是历史的某种延续。既然我们能够连续记录和观察每个消费者的历史,我们就有可能建立一种兼顾短期和长期的预测模型。就如那个被广为传颂的来自亚马逊的案例一样,如果你长期在网上采购月经棉,但最近两三个月不再继续了,而其他网购行为没什么变化,接下来亚马逊就要给你推送婴儿用品的广告了。当然,也有另一种可能,就是要推送一些帮你平稳度过更年期的药品。


关注So.Car官方公众号

掌握So.Car最新观点动向

张晓亮
张晓亮SoCar CEO

从事汽车市场研究咨询工作20年,专注于产品战略研究,先后服务于一汽大众、一汽集团、北汽集团、上汽集团、广汽集团和吉利等十余个品牌,参与40余款新车的产品定义工作。

最新报告更多