• 9阅读
  • 0回复

网址多达3.2亿 搜索“引擎”力不从心 [复制链接]

上一主题 下一主题
离线futa
 

只看楼主 倒序阅读 使用道具 楼主  发表于: 1998-04-30

    【美联社华盛顿4月2日电】现在,要用计算机在万维网上搜索就得从约3
.2亿个网页中挑选分类,而即便是最好的搜索软件也只为这其中不超过40%
的网页编了索引。
    据NEC研究所的史蒂夫·劳伦斯说,在因特网上,情况也不会变得容易,
因为预计今后几年中,网页的数目还将增长10倍,劳伦斯是发表于《科学》杂
志上的一篇报告的作者。
    劳伦斯说:“每时每刻都有成百上千的网页添加到网上。检索它们的简单办
法是不存在的。可能有大量迄今为止尚未有人真正访问过的网页。”
    劳伦斯和同为NEC公司研究人员的李·贾尔斯对科学家如何利用检索服务
查找万维网上的某个具体信息作了一番分析,这些检索服务有点儿像电子图书馆
管理员,它们通过主题或关键词对成百上千页资料进行分类和检索。人们通常把
这些服务称作“搜索引擎”。
    这些研究人员分析了5个最大的搜索引擎对575个科学搜索问题的回答。
随后他们各自对约15万页的信息进行了复核以发现有无重复、错误或检索错误
之处。他们还检查了链路,即搜索引擎提到的其他地点的因特网网址。
    劳伦斯说,根据这番研究,他估计一般的浏览器能访问到的万维网网页有大
约3.2亿。
    劳伦斯说:“这很可能是个很低的估计数。”但是,这比早先那些研究得出
的估计数大得多,那时认为万维网只有大约8000万到1.75亿个网页。
    拉特格斯大学的计算机科学教授海曼·赫什说,每个人都知道万维网上信息
庞杂,要找到网上的东西非常困难,那是个毫无组织、毫无秩序的信息源总汇,
完全让人无法对付。
    劳伦斯说,3.2亿的估计数不包括为口令或“搜索墙”保护因而浏览器或
搜索引擎无法进入的上百万网页。
快速回复
限100 字节
批量上传需要先选择文件,再选择上传
 
上一个 下一个