正在阅读:谷歌实时搜索上线 小心染上“咖啡瘾”谷歌实时搜索上线 小心染上“咖啡瘾”

2010-06-10 12:33 出处:PConline 作者:caoweiye 责任编辑:caoweiye

  近日谷歌筹备已久的实时搜索服务已经在google.com上线,在搜索结果页面左侧下部,新增了一个Latest的实时搜索结果显示入口。

谷歌实时搜索
谷歌实时搜索

  进入谷歌实时搜索之后,在Twitter发布的信息搜索结果会以滚动的形式出现,搜索结果能精确到(second)秒,而且这些实时的搜索结果会不断更新上来,有可能造成页面过度拥挤的情况。

谷歌实时搜索
精确到秒的实时搜索结果

  不过,大家可以看到谷歌提供了(Pause)暂停按钮,可以暂停同步实时资讯,而且右上角还有个关闭按钮可以关闭实时信息。

谷歌实时搜索
不到几分钟,Twitter信息已经增长了几十个

  而某些相关的实时搜索结果还会辅以滚动条,方便大家查看信息万变的实时搜索结果。

谷歌实时搜索
实时搜索带来的搜索结果变化

  谷歌“咖啡因”搜索系统

  见识了谷歌的实时搜索,我们不得不提及谷歌已经磨拳擦掌准备上马的名为Caffeine(咖啡因)的网页索引系统。因为“咖啡因”就是Google实时搜索可以实现的重要元素之一。

  去年8月,Google就曾经透漏过这个崭新的搜索系统,谷歌称Caffeine系统可提供比以前多一半的新的索引结果,收集到比以前更多的信息,而且Caffeine的索引速度比以前更快,就像奥运精神一样,更高、更快、更强。

谷歌实时搜索
谷歌“咖啡因”

  目前的搜索引擎主要是考爬虫系统,将之前已经爬到的内容放到数据库的索引中,实际上当你在Google进行搜索的时候,搜索得到的结果并不是最新的实时结果,而是Google之前已经存放在数据库里的索引内容。

  但是,随着网络的进化,内容极大的丰富,不仅是数量上的增加,还包括更丰富的形式,比如视频、图片、新闻、实时更新等等,而且人们对搜索引擎的期待越来越高,他们希望找到最新的最相关的信息,内容发布商则希望他们前脚发出的内容,后脚就可以在Google搜索到。

谷歌“咖啡因”系统
谷歌“咖啡因”系统

  为了赶上网络的进化和人们的期望,谷歌Caffeine 应运而生,上图显示了老式索引系统和Caffeine索引系统的区别。老系统由多个层组成,新老内容夹杂。但大多数的层需要几周才会更新一次,为了更新一个老的索引层,谷歌需要重新将整个网络分析一遍才能达成,所以不能保证让你看到的都是最新的内容。

  而有了Caffeine,谷歌就可以在很短的周期里就分析一遍网络,并更新索引库。而且谷歌可以做到只要一发现新的网页、就立即将网页里新的信息加入到索引库里,这样就能为你带来实时的搜索结果。

  谷歌还透露说,Caffeine每一秒可以并行处理成百上千个页面,如果将这些网页都打印出来,堆在一起能达到3英里厚。Caffeine每天会在单个数据库里增加将近1亿GB的新数据,你需要62万5千个最大的iPod才能存的下这些信息,如果将这些iPod连起来能排出40英里。

关注我们

最新资讯离线随时看 聊天吐槽赢奖品