个性化搜索到底有多大用?


  像大多数搜索引擎,谷歌存储了关于登录用户搜索历史记录的海量数据,并使用这些数据来调整算法以提供“更相关”的搜索结果。但是,这些个性化的搜索结果真的很有用吗?最近的一项研究对此提出质疑。

  “在考虑了所有情况之后,我们认为折衷不是很好的做法,”马丁•弗兹(Martin Feuz)说道,他是英国伦敦大学文化研究中心(Cultural Studies at the University of London)的研究员,曾参与此项研究。“我们丢弃了太多的私人信息并没有得到足够高品质的搜索结果。”

  文化研究中心的另一位研究员马修•富勒(Matthew Fuller)以及苏黎世艺术大学(Zurich University of the Arts)数字文化和网络理论学院的讲师费利克•斯施塔尔德(Felix Stalder),连同弗兹三人一起申请了伊马努尔•康德(Immanuel Kant)、弗里德里希•尼采(Friedrich Nietzsch)以及米歇尔•福柯(Michel Foucault)三个著名哲学家的虚拟谷歌帐户。他们从每位哲学家的书籍中收集出关键词,通过谷歌对这些关键词的搜索为其个人档案创建虚假的网络历史记录。弗兹承认这些虚拟档案可能不会反映普通用户的搜索条件,但他仍然认为,这项研究提供了对谷歌个性化结果的深入了解。

  研究人员利用每份个人档案来执行每组的测试搜索。他们采用了三组条件:第一组是与三个哲学家共同兴趣相关的条件;第二组是从社会书签服务的美味书签(Delicious)的热门标签中创建出的;第三组是由从几本书籍中收集的用语组成。然后研究人员将三份个人档案的所有条件下的搜索结果与通过匿名搜索(未登录谷歌帐户执行)所生成的搜索结果进行比较。

  研究人员发现,个性化的搜索结果大约能节省一半的时间。这些结果与匿名用户搜索到的结果有着明显的不同:在同一搜索条件下,前10个结果中有超过6个看上去是不同的。然而,他们发现在许多情况下这种变化并没有出现任何新的内容:大约37%的个性化搜索结果仅仅是将第二页的链接内容移动到了第一页,而只有13%的内容来自超出谷歌搜索结果前1000个以外的链接。

  最后,研究人员还发现,谷歌甚至在搜索查询和用户的网络历史记录之间的关系不明确的情况下,也提供了个性化搜索的结果。他们怀疑谷歌是在利用网络历史记录将用户分配到不同的人口统计学类别中,并对其搜索结果进行相应的调整。弗兹还说,他在关注谷歌正在调整用户所看得到的信息,但并没有明确说明这些信息发生变化的原因。

  哈佛大学贝克曼互联网与社会中心(Berkman Center for Internet and Society)的研究员伊桑•扎克曼(Ethan Zuckerman)认为,这项研究对谷歌的个性化搜索方法提供了很有用的经验主义观察角度。他还认为,由于整个行业都为了从相关性搜索(search-related)广告中赚钱而专注于博弈体系,谷歌不得不保持模糊算法。

  同时,扎克曼还关注谷歌没有明确,普通用户获取信息的方式是否被修改过。他注意到,尽管研究者试图约束谷歌的行为,但谷歌的搜索算法可能一直在调整以适应研究者。扎克曼说:“通过个性化搜索,我们正在对其中的精妙变化进行研究。”

  “对于现有的算法背负着太多的精神包袱,这是谷歌最大的挑战。”大卫·谢勒(David Schairer)说道,他是TrapIt公司首席技术官和创始人之一。TrapIt是一家专注人工智能方面的新创企业,旨在帮助人们在网上找到相应的信息。谢勒还说,无论是使用社会图谱个性化搜索还是传统方法搜索,“受欢迎的内容或高评价的信息往往是会永存的”。这就使得模糊算法变得很难,而高品质的信息将最终被找到。

  个性化搜索是谷歌努力扩大其搜索引擎社交理解力的一个方向。上周,谷歌推出了“+1”社交搜索服务,允许网络搜索用户推荐有用的搜索结果。弗兹认为,“+1”社交搜索服务可能会使得搜索结果中独特有用的内容链接数量增加。“若用户社交网络中的某位好友拥有‘+1’标志,可能人们会有非常大的信心将搜索结果排名远远在100条以后的内容提升至大约前10位。”弗兹说道。

  弗兹还说,他希望能看到谷歌对个性化搜索结果的链接突出显示,并且给用户在个性化搜索结果与普通搜索结果之间进行切换的权利。这样用户就可以明白算法是怎么影响那些对他们有用的信息的。