苹果,华为,还是联想?
10.2英寸,10.9英寸还是12.9英寸?
128G,256G还是512G?
支持手写笔吗?音响效果怎么样?软件多不多?屏幕像素多少?……
在挑选一款产品时,消费者往往会关注产品的各种属性。对于平板电脑这种复杂的电子产品,产品属性的类别尤其多:屏幕尺寸、屏幕像素、机身重量、外观颜色、电池寿命、蓝牙延迟程度、品牌声誉、价格等等。而对于营销人员而言,产品属性在竞争定位、品牌战略和新产品研发等多个领域发挥着重要作用,基于产品属性的营销方法(如联合分析法、市场结构分析等)的实际应用也日益增多。因此,营销人员也迫切地渴望了解“消费者到底关注哪些产品属性”,以指导产品迭代、营销推广等实践策略。
产品属性可以分为两类:工程属性(engineered attributes)和元属性(meta-attributes)。工程属性是在产品规格说明中详细罗列的属性(如屏幕尺寸、蓝牙技术等级、5G支持性),更容易在营销实践中被识别,但工程属性不一定会影响消费者对产品的评价;真正会影响消费者评价的是元属性,即满足了消费者需求的属性。举个例子,消费者可能完全不理解一款耳机使用的蓝牙5.0技术(工程属性)是什么,但他们可能会夸赞耳机的连接性(元属性)很好,无杂音,无延迟。
为了更好地满足消费者需求,营销人员希望能识别元属性。传统的用户调研方法非常耗时,且调研得到的静态结果难以适应瞬息万变的市场。那么有什么更好的方法可以识别元属性吗?来自韦仕敦大学的 Xin (Shane) Wang,纽约州立大学布法罗分校的 Jiaxiu He,辛辛那提大学的 David J. Curry,香港城市大学的 Jun Hyun (Joseph) Ryoo 利用机器学习和自然语言处理技术,发明了一种能从消费者评论中揭示工程属性和元属性之间联系的方法——属性嵌入模型(Attribute Embedding Model)。
认知局限、属性层级 & UGC数据分析
在挑选平板电脑时,消费者需要对许多工程属性进行组合比较。认知理论(Cognitive Theory)强调了人类在信息处理能力上的局限性——在比较多种属性,甚至还需要考虑属性之间关系时,消费者的选择变得尤其困难。
鉴于上述认知局限,关系学习理论(Relational Learning Theory)表明,虽然没有明确说明,但消费者会将工程属性分组,以形成更高级别的属性,帮助他们进行多维比较。例如,如果把屏幕分辨率(如像素)和背光照明方法(如RGB LED、阴极荧光灯)等工程属性归为一个更高级别的属性——视觉清晰度,这一过程减少了消费者需要处理的属性数量,满足了认知局限,那么消费者的信息处理过程就会变得更容易。
上述理论表明,随着消费者在平板电脑类产品中不断搜索,树状的“属性层次结构”会自然形成。而哪些属性属于同一层级呢?“消费者评论”这种用户自生成内容(User Generated Content,UGC)给了我们线索。作者对消费者评论数据进行挖掘,提取评论中工程属性的上下文数据,将上下文相似的工程属性聚类为同一层级。
属性嵌入模型
让我们以平板电脑这一品类为背景,举例说明作者们发明的属性嵌入模型。最初始的语料库为针对平板电脑产品的评论(如图A中的 review1 和 review2)。模型处理过程如下:
(1)数据清洗和特征词提取。剔除上述文本数据中多余的信息(如冠词、连词),并根据单词的词性对句子进行分词处理,借助自然语言处理技术推断出名词/名词短语中包含的产品工程属性。在图A的例子中,评论中包含的工程属性包括重量、电池寿命、USB接口、apps、屏幕大小、YouTube、蓝牙。
(2)使用 word2vec 提取元属性。Word2vec 是一种自然语言处理工具,它能将语料库中的文本数据输入神经网络,并输出工程属性单词的语义向量。在向量空间中,上下文(该单词前后邻近的单词)相似的工程属性彼此更为靠近。随后,根据工程属性的相似性进行聚类,提取元属性(如图A中提取出了三个元属性:硬件规格、无线连接和多媒体与应用),得到属性层次结构。
(3)情感分析。消费者对不同工程属性的评价会有不同的评估,可能是正面的,也可能是负面的。在“从工程属性到元属性”的聚类中,属性嵌入模型可以保留工程属性的效价信息。如图B所示,在 review1中,消费者对重量和电池寿命两个工程属性的评价是积极的;而在 review2 中,消费者对屏幕大小的评价是负面的。右侧的色条体现了聚类后硬件规格这一元属性的消费者情感效价。
平板电脑的属性层次结构
上文已经介绍了属性嵌入模型是什么,那么,这个模型怎么用呢?
作者在2014年3月从亚马逊平台上收集了 88, 901 条关于平板电脑产品的在线评论,每条评论平均包含 9.14 个句子,每个句子平均包含 15.4 个单词。在对数据进行清洗后,作者利用自然语言处理技术从上述文本数据中推断出共 62 个工程属性。通过 word2vec 提取包含上下文的语义向量并聚类后,模型共提取出7个元属性,分别是存储、无线连接、附件与外围设备、多媒体与应用、操作系统、用户界面和硬件规格。最终得到的属性层次结构如下图所示。
营销人员可以利用提取出的7个元属性,结合情绪分析,对比市场上各品牌的优劣势。
从下图A中我们可以看到,相比于戴尔,苹果和三星在所有7个维度上均表现出高分。苹果在多媒体与应用方面具有优势,三星则在无线连接方面具有优势。苹果和三星是平板电脑市场的领导者,相比于这两个品牌,作为廉价品牌的戴尔则在所有元属性的情绪得分上都乏善可陈。
下图B则展现了两个退出市场的品牌——惠普和东芝——的元属性情绪得分图。惠普平板电脑独有的WebOS得到了消费者很高的评价,但由于“数量非常少的WebOS应用程序”,惠普平板电脑最终退出了市场。东芝则在存储和附件与外围设备方面具有竞争优势(东芝平板电脑提供全尺寸的SD卡插槽、USB端口和HDMI端口),也正因为上述属性,东芝平板的电脑又厚又重;此外,东芝在多媒体与应用上也得到了低分。以上分析结果给平板电脑提供商发出了明确的信息:如果不找出并纠正元属性弱点,就很可能步入惠普和东芝的后尘。
营销人,你会怎么做?
作者发明的方法能够从用户自生成的评论中捕获工程属性和元属性之间的联系,搭建属性层次框架。营销人员可以利用得到的元属性维度,分析自家产品对比其他品牌的优势和劣势。假设你是苹果的营销分析师,你会得知相比于三星的平板电脑,苹果的平板电脑在无线连接这一元属性上处于劣势。但如果仅仅将这种差距简单地呈现给企业战略家是不够的,因为产品工程师想知道的不仅仅是存在差距,他们还想知道应该从哪些方面着手解决这一问题。这时,你就可以顺着属性层次框架,找到无线连接这一元属性对应的关键工程属性(即3g、网络摄像头、wifi、蓝牙和GPS)。这样,产品工程师就能清晰地明确产品未来的改进方向。