2)第284章 谷歌一下_花开美利坚
字体:      护眼 关灯
上一章 目录 下一章
  来,然后喝了一口红茶。

  她一边喝着茶,一边在思考着应该如何写一个网络蜘蛛的程序出来。

  评价一个网络蜘蛛的好坏,有三个方式,一个是覆盖率,网络蜘蛛的首要目标是抓取互联网上所需的信息。因此,有价值的信息是否都收录,收录的比例是网络蜘蛛的基本评价指标;第二个则是时效xing,即事件发生并在互联网上传播后(以新闻、论坛、博客等各种形式),用户需要通过搜索引擎尽快能检索到相应内容。而索引的前提是收录,因此需要网络蜘蛛尽快的抓取互联网上最新出现的资源;最后则是重复率,互联网上重复的内容很多,如何尽早的发现页面重复并消除之,是网络蜘蛛需要解决的问题。除转载导致的重复外,重复总能体现为各种不同的模式,站点级重复,目录级重复,cgi级重复,参数级重复等等,及早发现这些模式并进行处理,能节省系统的存储、抓取、建库和展现资源。

  第一个问题最好解决,因为美国电信的根服务器就在宜页的覆盖率永远都是100。

  需要解决的是第二和第三个问题。

  事实上这也不是个大问题,原理很容易解决,最重要的一环在于需要一个高效率的程序。

  光凭自己一个人的话,可能需要不少的时间。凯瑟琳一直梦想的是当一个甩手掌柜,这事怎么能够发生呢?——于是,找人就是必须的。

  最后,凯瑟琳决定从微软的phoenix-stargate开发组chou调了三个人出来,帮助开发这个网络蜘蛛程序。

  反正星mén系统的开发已经差不多了,这个时候自己chou调一些人出来开发网络蜘蛛完全不是问题。

  网络蜘蛛是搜索引擎的一个最核心的部分。有了这个程序之后,搜索引擎的建立就会非常简单了。

  那……自己的这个网站应该叫什么名字呢?

  百度?

  她首先就想到了这个名字。

  凯瑟琳摇了摇头,与其叫百度,还没有谷歌来得更有味道。毕竟,后者可是全球xing的搜索引擎,而前者只能局限在中国大陆地区嘛……而且更重要的一员原因是,凯瑟琳对于百度的某些功能非常的有怨念,而且还不能翻墙。

  在这上面,谷歌的搜索就方便多了——前提是用国外版,好孩子片什么的,很容易就可以找到。虽然这是上辈子的情感,但是凯瑟琳觉得还是谷歌稍微要好那么一点点。

  最后,凯瑟琳决定将自己的这个网站命名为google,也就是谷歌。

  不过凯瑟琳并不打算如同历史上的那个谷歌公司一样去涉及各种的产业,什么手机、办公都一网打尽。

  自己已经有了专mén的手机部mén,微软也是自己的,谷歌公司所要做的事情,就是扮演好一个搜

  请收藏:https://m.wxxs123.cc

(温馨提示:请关闭畅读或阅读模式,否则内容无法正常显示)

上一章 目录 下一章