分类
个人日志

采访李开复:谷歌开放接口人肉搜索 竭力亲人搜索服务

5月18日,周末,笔者来到谷歌中国公司,谷歌员工似比往常更加忙碌了。

5月16日谷歌推出“灾区亲人搜索”,有些网民仅仅通过页面,难以理解所谓亲人搜索到底如何,笔者也带着这个困惑,走访了部分谷歌中国公司员工。谷歌中国区总裁李开复亦对此详加解释,并进行了演示。

夜以继日人肉搜索

据了解,四川汶川发生强烈地震后,谷歌公司即迅速组织了大批人力,加班加点进行地震救灾的相关工作。

此番推出的谷歌灾区亲人搜索,展现在我们眼前的仅仅是个页面,背后却是几十位工程师,夜以继日、两天没合眼加紧推出的。

由于搜索引擎爬虫对于网页信息抓取有个价值判断周期,对于正在发生的汶川地震相关信息,技术上的网页权重和实际上的价值有效存在一定落差。特别是在寻找亲人这一方面,许多网站比如成都社区、新开的站“512寻人网站”以及一些医院的网页等,根本就没有PR,网页内容权重特别低。但是民众对于亲人寻找又是十分急切,这就需要对网页内容的选择、抓取进行一定的人工干预。

谷歌技术人员Devin Chen告诉笔者,谷歌亲人搜索已经不是传统意义上的搜索引擎那样,依靠机器自动抓取内容。亲人搜索的每一个网页都是谷歌员工通过手工或者其他技术举措找到的。

他解释说:Custom Search Engine可以针对特殊提交的网页做一个小范围的搜索。同时,他们增加了Google App Engine 的功能,放入了一个数据库,这样当有官方信息的时候,会有一个onebox 的出现。对于其他公司提供的资源和引擎比如百度、搜狗等抓取的信息,也把它们融入进来,以求信息最大化地有效。

这个平台,主要在于谷歌对外开发的两个技术平台,尽管技术创新并不突出,但实用性却非常高。

Devin Chen说,谷歌亲人搜索的性质几乎就是一个大家所说的“人肉”搜索,他们花了相当大的功夫和心血,上百人不眠不休地工作。除了大批量录入新的网页之外,在发现网络爬虫不够实时,他们就一个个的copy-paste这些内容。特别还有些网站是用Ajax技术,爬虫很难获取信息,非须人工进行甄别不可。除了人工繁琐加工,还购买了大量卫星数据,力求亲人搜索有效。

踊跃捐款捐赠广告

通过数天的运行,谷歌亲人搜索亦取得了预期效果,寻找亲人上谷歌平台已经成为许多网民的首选。据悉,四川电台也开始通过谷歌相关平台要求得到帮助,把想捐赠的人和需要的物资联系起来。

这几天我们经常可以看到,在谷歌自己的广告平台上,出现不少自己的广告,比如对于亲人搜索这一新服务进行推广。谷歌中国公司市场部的人员每天晚上三点才回家,在买全球广告词,以吸引外国人捐钱,笔者通过一些英文搜索引擎可以看到,搜索"china earthquake"会看到许多谷歌对于此次地震救灾的广告。

我是一个四川人

李开复告诉笔者,作为四川人,对这次的灾难有特别深的悲伤和感触。特别是处于他这样一个位置,更多地感受到一种责任。笔者也看到他也是满脸愁容,眼睛充满哀伤。

李开复介绍说,灾难发生后,谷歌数百名员工几乎没有怎么休息,赶制各种尽可能的服务。公司只有五百多人,两三天就募捐了一百五十万元,谷歌公司层面直接捐款200万美元。他们还通过捐赠关键词广告 方式,在全球使用100种语言进行"中国地震捐款"或其他关键词的针对性捐赠。而且这种具有很强针对性的捐赠,将会比此前缅甸具灾推出的全球首页捐赠更加有效。

李开复最后表示,谷歌中国公司作为一家中文搜索引擎,永远会把华语网民的需求置于首位,这一点毋庸置疑。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注