1、1基于图书“基因”的阅读推荐:BookLamp亚马逊和苹果分别对 Goodreads 和 BookLamp 的收购是两者在阅读市场上角力的具现化最新缩影。哪个选择更正确?现在还很难说。 热词:图书”基因”分析 BookLamp 阅读市场博弈 几乎每一家购书网站和阅读社交网站都会向读者推荐图书,但它们往往是基于读者既往的购买史和阅读史做出推荐。那么,有没有一项服务能基于图书本身的内容和语言进行推荐,而不被图书的流行程度、 “水军”的造势或者出版商的营销手段等外部因素所左右呢?美国爱达荷州的一家大数据图书分析服务提供商书灯公司(BookLamp)就可以提供此类图书推荐服务。BookLamp 的前身
2、是成立于 2003 年 6 月的新奇计划公司(Novel Projects, Inc.) ,这家公司希望通过语义的不断计算与挖掘,开发出各类新颖的软件和服务。2007 年 2 月,他们将语义技术结合出版产业,创立了 BookLamp 公司。这个团队最有代表性的项目是 2010 年 8月上线的“图书基因组计划” (Book Genome Project) ,该服务利用自然语言分析技术为用户推荐图书,并为出版行业提供帮助。 一、核心技术:图书“基因”分析技术 一直以来,购书网站上的图书推荐引擎提供服务的方式不外乎以下几种:“购买了某本书的人还购买了这些书” “这些书是编辑精选” “这些书正在热销”
3、 “这些书广受好评” 。然而,就算购买了同一本书,不同读者的阅读兴趣和阅读习惯仍然可能存在巨大差异;2作者热门或图书卖得好也不甚靠谱;而流行趋势、编辑精选等基本就是营销造势的结果。以上推荐方法都不能准确地帮读者找到自己喜欢的书,因为它们都是基于一本书外在的特征、条件和状况,而不是根据图书的题材、内容、语言风格以及作者能力和水平等更内在的特点来做出推荐因此是不全面的,很多时候也是不准确的。 BookLamp 的图书“基因”分析技术则另辟蹊径,不关注作者也不关注读者,仅根据书籍自身的“基因”来作出阅读推荐。具体来说,BookLamp 将一本书的“基因”总结为语言风格和故事情节两方面,其中,语言风格
4、 DNA 由语言密度、语言节奏、对话、描述和运动组成;故事情节DNA 则由关键主题词组和写作手法组成。对于后一点,BookLamp 的创始人亚伦?史坦顿(Aaron Stanton)曾在接受媒体采访时打过一个恰如其分的比喻, “就像你吃了一块很好吃的巧克力蛋糕,如果你想找到其他口味类似的蛋糕,你所需要知道的不仅仅只有其成分,还需要知道各个成分的比例。 ”从这个角度来看,一本书的关键主题就是其成分,而写作手法就是其成分比例。在对一本书进行分析时,BookLamp 会对书的内容进行扫描,将全文分解为一百个场景,然后依据自然语言算法分析每个场景的“DNA”语言、情节、写作思路、主题及形式等(Book
5、Lamp 总结了 2000 多个特性) ,同时计算不同主题所占成分(BookLamp 总结了 132个主题) ,多方位评估书的内容,并基于评估结果绘制图书的“基因图谱”。比如说,史蒂芬?金的午夜行凶 (Salems Lot)在图书基因组计划中被解析出四个主要特征:吸血鬼/超自然;葬礼/死亡/追悼;家庭/家庭环境;痛苦恐惧/消极情绪。BookLamp 将这四个特征随故事线进展所占比3例的变化用图表描绘出来,遂形成午夜行凶的基因图谱,如图 1 所示。 图 1 午夜行凶基因图谱 二、用户价值及商业模式 “基因图谱”分析有助于读者找到心仪的图书。用户在使用BookLamp 支持的服务时,先选取自己喜欢
6、的一本或几本书,BookLamp 会将该书的“基因图谱”与数据库中的进行适配,为用户推荐同类型的、用户也可能喜欢的图书。用户会惊喜地发现,BookLamp 为自己推荐的图书与自己喜欢的书具有相似的语气、观点、描述,甚至有类似的戏剧冲突。举例而言,如果读者喜欢达?芬奇密码 ,想要找一本类似的小说,BookLamp 会先拉取系统此前对该小说的分析数据。分析数据显示, 达?芬奇密码有 18.6%的内容涉及宗教和宗教机构,9.4%的内容涉及警方和谋杀案的调查,8.2%的内容涉及艺术和艺术画廊,6.7%的内容涉及秘密结社,以及历史文化、旅行、寻求真相等其他元素。然后该系统会用这些故事情节 DNA 数据以
7、及该书的语言风格 DNA 数据去比对数据库中的其他书籍,最后返回失落的秘符 最后的圣殿骑士 巴拉巴德的七把钥匙等小说,这些书的内容都包含与达?芬奇密码相似的元素与元素比例、语言风格,如图 2 所示。 图 2 达?芬奇密码的基因图谱及与之相似的图书 上文分析了 BookLamp 能为读者创造的价值,那么,BookLamp 采用怎样的商业模式呢?一方面,和 Pandora 或者豆瓣类似,BookLamp 所推荐的图书都带有一些电商链接,比如 eBay、亚马逊等,当用户购买行为产4生时,BookLamp 可以获得一定的提成。另一方面也是更重要的一个收入模式,BookLamp 为出版商及分销商提供图书
8、数据分析服务。BookLamp 利用自己收集并分析的各类书籍信息,帮助各类出版商和分销商来更改他们的目标定位和宣传,以更好地影响那些本来就爱看这类书的人。此外,BookLamp 的数据分析服务还给出版商提供了一个平台,出版商可以通过这个平台来筛选手稿,分析一本书籍在特定读者群中的受欢迎程度,或者其市场预算应该为多少。BookLamp 的主要客户包括亚马逊、苹果,还有像兰登书屋这样的图书出版商。兰登书屋和肯辛顿图书公司(Kensington Books)已经让 BookLamp 分析了他们的两万本书。 三、BookLamp VS Goodreads:巨头间的竞争 BookLamp 先进的图书分析
9、技术吸引了相关竞争领域巨头公司的关注。亚马逊曾与 BookLamp 展开过收购谈判,但它最终于 2013 年 3 月收购了BookLamp 的竞争对手Goodreads。Goodreads 是一个阅读社交网站,可供用户搜索、分享书籍,或发表书评、更新读书进程等,就像豆瓣读书一样。作为世界上最大的在线读书俱乐部,Goodreads 上有一千多万用户标注自己想读和正在读的书,但是它提供的图书推荐服务是基于社交网络的,无法提供像 BookLamp 一样基于书籍自身内容的图书推荐功能。BookLamp 与之相比,更像是潘多拉音乐盒(Pandora)Pandora 按照“Music Genome Pro
10、ject(音乐基因组项目) ”算法给喜欢音乐的人推荐曲目,BookLamp 同样也是通过扫描内容以获得可量化的相似点来完成推荐。 2014 年 7 月,苹果公司被曝以 1000 万美元至 1500 万美元的价格收5购了 BookLamp 及其“Book Genome Project(图书基因组计划) ”技术。之后,BookLamp 在一份声明中称将不再向用户推出原有服务,也证明这份收购确已成立。苹果对 BookLamp 公司的收购战略意图明显这笔收购使苹果公司成功地在阅读市场布下一颗棋子,为其在阅读推荐领域和亚马逊的竞争赢得了足可抗衡的筹码。一方面,收购中断了 BookLamp 为亚马逊提供的
11、服务,使其此后只为苹果提供服务,同时也让苹果获得了其客户;而更重要的是,该公司的技术和人才可以帮助苹果在阅读领域中打造更有竞争力的产品,更好地对抗亚马逊。 亚马逊和苹果分别对 Goodreads 和 BookLamp 的收购是两者在阅读市场上角力的具现化最新缩影。随着电子书经销商提供的书籍越来越多,任何公司想在电子书领域有所作为,显然不能维持现状单纯销售图书。它们需要想办法来为这些书籍增值对于用户而言,买书在哪儿不是买,它们必须为用户提供额外的价值,比如符合用户个人特点的个性化推荐。如果苹果或亚马逊给出的推荐能够得到用户认可,那么用户就可能更加信赖它,并进一步购买或者租赁书籍。对此,亚马逊和苹
12、果作出了不同的选择。亚马逊收购 Goodreads,是选择了基于社交网络与口碑传播的阅读推荐,让用户的熟人或志趣相投的网络圈子关于某本书的新鲜事引导用户发现图书。而苹果对 BookLamp 的收购则是选择了基于书籍自身内容的阅读推荐。苹果的 iBook Store 电子书平台提供“编辑精选”一类的服务,但是没有突出用户个性化的特点,在亚马逊收购Goodreads 抢先夺取了用户数据的情况下,要凭借什么与 Kindle Store竞争呢?显然 BookLamp 的内容和风格分析法可以派上用场。 6哪个选择更正确,现在还很难说。但我们能知道的是,BookLamp 将帮助强化苹果公司的电子书服务,成为其和亚马逊在阅读市场博弈的武器。 作者单位系武汉大学数字出版研究所,本文为自科基金项目“科技信息用户价值模型构建与实证研究(71373196)的研究成果