谷歌最近發(fā)現(xiàn),互聯(lián)網上的獨立URL數量超過了1萬億個。
谷歌高管本周五在該公司博客上表示,這應當歸功于谷歌的工程師。谷歌工程師發(fā)現(xiàn),互聯(lián)網上每天新增加數十億個網頁。
在公布這一數字的同時,谷歌還趁機炫耀了自己的索引數據庫規(guī)模。谷歌互聯(lián)網搜索基礎架構團隊的軟件工程師杰西·阿爾帕特(Jesse Alpert)和尼?!すZ吉(Nissan Hajaj)在博客中寫道,“我們沒有對這1萬億個網頁中的每個網頁進行索引——許多網頁彼此相似,或者是自動生成的內容,這些網頁對搜索用戶沒有什么用處。但我們對擁有最完整的索引數據庫感到自豪,我們的目標是索引世界上的所有數據?!?nbsp;
過去谷歌一直公開宣揚其索引數據庫的規(guī)模,各大搜索引擎廠商經常為此爭得不可開交。后來它們發(fā)現(xiàn),大多數搜索用戶通常只會翻看兩頁搜索結果,有關索引數據庫規(guī)模的口水仗也因此而結束。換句話說,最重要的是向用戶提供10-20個相關度較高的鏈接,或者是直接回答用戶的問題,因為沒有用戶會從5000個搜索結果中查找自己想要的信息。谷歌公布的這一信息是否會導致雅虎、微軟和Ask.com的激烈反應還不得而知。
阿爾帕特和哈賈吉在博客中還寫道,目前,谷歌不停地下載整個web,收集更新網頁的信息,并每天對所有web鏈接進行數次處理。
