| Google欲索引千亿网页 互联网网页总数约2000亿 |
热 ★★★ |
| Google欲索引千亿网页 互联网网页总数约2000亿 |
|
| 作者:佚名 文章来源:硅谷动力 点击数: 更新时间:2006-9-23 |
|
|
据国外媒体报道,1996年,还处在发轫阶段的Google搜索引擎已经抓取了2400万个网页,今天Google索引的网页数量高达250亿个。技术发家的Google并未就此满足。据美国“Site Pro News”网站报道,最近公开的一项Google专利显示,Google的目标是索引千亿数量级的网页。
这家网站报道,这个专利的名字叫做“基于多索引的信息查询系统”,是由Google公司的员工阿纳·帕特森在去年一月份申请的,在今年五月份外界才获悉。这个专利显示,Goolge计划索引一千亿以上的网页。
根据这份专利称,传统所谓“搜索引擎”的信息检索系统只能够查询到互联网上很小一部分的网页和文档。据估计,目前整个互联网上的网页数量已经高达2000亿,而帕特森认为,最好的搜索引擎(即Google)也只能抓取不到十分之一。
据报道,Google这项新的检索技术具有两大特点,其中一个是可以索引千亿数量级的网页。另外一个特点是可以保存同一个网页的在不同时期的版本。从而向查询用户提供最佳版本的信息。
1996年,Google公司索引的网页数量为2400万。到2000年8月,Google将这个容量扩大了四倍,达到十亿个网页。2003年9月,Google公司在首页上宣布,已经索引了33亿个网页 然而据业内研究机构Microdoc称,Google当时的网页数量已经超过了50亿。这家机构在一份报告中指出,Google有意“瞒报”了其网页索引数据库的规模。
|
|
|
| 文章录入:qiwenjing 责任编辑:qiwenjing |
|
上一篇文章: Google开启新一轮扩张计划 美国新增员工1000人
下一篇文章: Google还需要一点时间 |
| 【字体:小 大】【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口】 |