译者注:网站推荐机制是电子商务或内容网站的核心功能之一。例如你在一个网站买了一本书后,网站会推荐其他你可能会感兴趣的书。这被认为是亚马逊等电子商务巨头成功的关键。本文对几个出色的推荐系统进行了较透彻的分析。
2006年10月,Netflix搞了一次不寻常的有奖竞赛。这家网上DVD租赁公司开出奖金一百万美元,奖励给能把他们网站的产品推荐机制提高10%的人。Netflix 以富有创新精神和闯劲著称。而一百万美元的奖金对于这样一家公司来说,其实并不象听起来那么多。 有奖竞赛还在进行当中(“至少要进行到2011年10月2日”)。所以这是一场炒作活动还是希望花小钱进行研究,我们还不得而知。而对Netflix来说,更好的推荐机制是必不可少还是锦上添花?今天,Netflix正面对从沉睡中醒来的巨人BlockBuster的挑战(参见译言前文),因此它必然要寻找制胜的先机。出色的推荐机制会留住老用户,吸引新用户。比如当一个用户还DVD时,系统会推荐给他/她可能会喜欢的另一部电影。这就增加了这个用户回来再租DVD的可能。 浏览与推荐 一个出色的推荐机制不光对Netflix,对其他网络企业也非常重要。这是因为用户的网上活动分为两类:搜索和浏览。当消费者明确知道她想要什么的时候,她搜索。但当她不太清楚想要什么的时候,她浏览。浏览活动为推荐系统带来了绝好的机会。因为当用户没有集中注意力在找她想要的东西时,她对外来的建议是敞开的。 在浏览过程中,用户的注意力(和他们的钱),都等着你去抓住。通过向用户展示有吸引力的东西,网站可以使交易成功的可能最大化。所以如果网站能增加给用户提供好推荐的几率,就能赚更多钱。显然这不是一个容易解决的问题,但解决这个问题带来的好处是巨大的。推荐的几种方式如下: 个性化的推荐——根据用户过去在网站的行为进行推荐社会化推荐——根据类似用户过去在网站的行为进行推荐基于产品的推荐——基于产品本身的特性进行推荐以上三者的混合 我们现在通过实例详述上述方式。包括老牌网站如亚马逊 Amazon,以及新秀如Pandora(译者:一个收听网上音乐的站点)和del.icio.us(译者:著名的社会化书签网站)。 亚马逊——推荐之王 亚马逊被广泛认为是网上购物行业的领袖,特别是推荐机制的使用。过去十几年间,该公司投入了大量金钱和脑力开发推荐机制,来促使用户更多地购物——包括对你浏览历史、购买历史,以及其他用户购买数据的分析。让我们看看亚马逊推荐机制的几个方面。下面是登陆到我的亚马逊帐户后网页显示的主要部分: (译者:上图抬头是“消费者浏览了这件商品后买了什么?”下面是三件商品:52%的消费者买了你正在看的这套衬衣;19%买了另一种款式;5%买了灰色的那种) 这部分是社会化推荐。注意,非常量化的分析,给我一个基于数据统计的理由为什么我应该买这套衬衣。而同时这又是个性化的推荐,因为它基于我刚刚点击查看的产品。 (译者:上图抬头是“为你准备的新货”。下面是几本书以及链接“为什么我们推荐这本书给你?”) 这一部分是“基于产品的推荐”,具体说是新书推荐。点击“为什么我们推荐这本书给你?”的链接会显示我的购买历史。因此这同时也是个性化推荐——基于我过去行为的推荐。 这一页上有其他四个部分采用上述推荐机制的结合。我们用下表概括:
很自然,这个系统是对称和覆盖全面的。所有推荐都基于用户个人行为,加上商品本身,或者是其他用户在亚马逊的活动。不管是因为你以前购买过相关产品,还是因为其他很多用户都喜欢,亚马逊每推荐给你一件商品,都增大你把它放进你的购物筐的可能。 超越亚马逊 亚马逊的推荐系统是程序自动化和用户相关购物信息天才集合的经典之作。亚马逊花了十几年的时间建立和完善了这个系统。这个系统基于产品和相关用户的巨大数据库;记录的信息包括你在过去几年或几分钟内做过什么。其他新公司如何与之竞争呢? 出乎意料的是,有办法竞争。答案来自与网络购物没什么关系的学科——遗传学。如你所知,遗传学研究DNA片段——基因,如何承载影响人类特性和行为的密码。比如一家人因为他们有某些基因是相同的,因此长相和行为有类似之处。遗传学是一门有150年历史的学科,在医学和历史学的研究中都是一个重要工具。但遗传学一个出乎意料的应用于2000年1月6日出现——Time Westergren和他的朋友们决定把遗传学的概念引入到音乐中。 潘朵拉(Pandora)——基于遗传学的推荐系统 音乐染色体组项目的推出,目的在于把音乐解析成为最基本的基因组成。它的基本想法是:我们因为音乐的某些特性喜欢音乐——那么为什么不能根据音乐的某些相似之处设计出一套推荐系统呢?这类推荐系统应该属于基于产品的推荐。但具有深刻创新意义的是,产品(音乐产品)的相似性,通过“基因”组成来衡量。 (译者:上图是Pandora音乐播放器向用户解释为什么播放一首歌曲:“基于你告诉我们的信息,我们播放这段音乐。因为这段音乐微妙地使用人声合声,混合了声学和电子乐器,有以人声为核心的审美特点,音调以大调为主,以及其他音乐基因组项目中发现的相似性。”) 在奋斗了几年,分析了海量的音乐后,这个项目积累了足够的数据,并推出了名为Pandora的在网上收听音乐的服务。Pandora 由于准确的推荐和用户低成本进入(译者:指用户可以很容易地就试用Pandora的服务)取得巨大成功。用户只需选一名歌手,或一首歌,就可以建立一个用户自己的电台,播放类似的音乐。 这种“即刻满足感”是很难抗拒的。因为Pandora 了解音乐相似性背后的因素,它不需要了解用户的好恶,就可以把用户黏住。确实,Pandora 需要把握用户的口味或记忆——但这正是蕴藏在音乐本身的DNA中了。当然Pandora有时并不完美,会播放不对用户口味的音乐。但这很少发生。 很自然地我们会问:这个基于基因的推荐方式能不能应用于其他产品——如书籍、电影、酒、餐馆、或旅游点呢?对于每一类产品,它的基因又由什么因素组成呢?比如说,对葡萄酒来说,它的基因是否包括对酒的口味的描述呢:黑莓口味、土味、果香型、复合型、混合型,等等。而书籍的基因是否是描述故事情节的用语呢?如果基因真的是让某一个物体在我们头脑中产生独特形象的因素,对于不同的事物我们应该可以把他们的基因定义出来。其实在过去的几年间,我们已经在互联网上做这样的事了。这就是“标签(tagging)”。 Del.icio.us -标签会成为基因么? Pandora 的初始投入是巨大的。因为成千上万的音乐需要人工来鉴定。社会化书签网站中首屈一指的 del.icio.us (见译言有关del.icio.us的译文)则采用不同的办法——让用户自己来鉴定、标识。这种自组织的方式相当成功,del.icio.us 很快在最初的使用者中流行起来。今天,del.icio.us 已经不仅仅是一个书签网站——它还是一个新闻网站和搜索引擎。但del.icio.us是否也是一个推荐系统呢?
(译者:上图显示加了“Linux”标签的最受欢迎的网页链接,右侧是相关标签。) 答案是肯定的。这是一个非常简明的推荐系统,它指基于一个基因——那就是一个标签。例如在上图中,我们看到最受欢迎的加了“Linux”标签的网页链接,同时还看到相关链接如“Open source (开源软件)”和“ubuntu (Linux 操作系统的一个版本)”。而一个更令人兴奋的推荐系统是基于多个标签的吻合。然而由于算法还不完善,这一点的作用并不明显。但至少,这一功能对于Read/WriteWeb 的网页(译者:原文的站点)是有效的,在下图中,可以看到右侧显示的与 Read/WriteWeb 类似的其他博客。 因此,del.icio.us 的机制有可能发展成为一个有趣的自助分类、组织的推荐系统。如果有足够的用户并逐步调整系统,用群体的力量加标签的方式可以建立起一个对书、葡萄酒、音乐同样有效的推荐系统。前题是,标签要准确到能够成为被标签对象的基因! 结论 推荐引擎是网上电子商务系统和用户体验的一个重要组成部分。网上零售商们有强烈的意愿向那些正在浏览的用户提供推荐,以驱使他们购买。亚马逊有一套非常出色的个性化推荐系统,是这个领域的领先者。其他网上零售商面临的问题是缺乏用户信息和软件构架不完善。 最新的推荐引擎,如受遗传学启发的Pandora和基于群体社会化标签的del.icio.us都是非常有趣的新发展。这些系统的长处在于“即刻满意度”——不需要用户提供他们的偏好和过去的浏览或消费历史。不管未来如何发展,亚马逊、Pandora和del.icio.us目前展示了极其出色的推荐技术。我们向您推荐这几个系统,并对未来拭目以待。 |