第九十六章 林总去哪了(上) (第2/3页)
牛相信自己。毕竟,像这种高级人才一般是不缺钱的,他们更需要的是理解自己的人,是实现自己的理想和抱负。除了另一位技术大牛,普通人很难用好这种人,因为没有共同语言,交流不来。
这个逻辑,并不适应于那些成熟的行业,但对于高新技术行业是适用的。
因此,林潇潇创业计划的第一件事情不是注册公司、不是找志同道合的伙伴,而是学习。
搜索引擎的概念已经被提出来,相关的论文发表了不少,只是还没有进入大众视野。
林潇潇花了一些钱将相关的论文都搜集起来,一边学习,一边自己研究。
搜索引擎的实现,首先需要遍历整个网络。
这个不算多难,写一个爬虫程序,用递归算法,不断地抓取网页即可。网页和网页之间都是互相链接的,极少有网页会孤立存在。只要爬虫运行一定时间,是可以访问到绝大部分网页的。
其次需要建立索引。每抓取一个网页都要精简为纯文字信息,建立索引,存入数据库。
最后才是搜索,根据关键字,首先搜索数据库,将相关信息进行排名,最后显示相关网页。
这个排名就是搜索引擎算法的关键。只有把用户最想搜到的信息排在前列,这个搜索引擎才有价值。
林潇潇大致知道前世某搜索引擎的排名原理。其核心逻辑是:一个网页被其他网页引用的次数越多,那么它就越有价值,就越需要被排在前列。
还有另一种逻辑:对关键字进行明码标价,谁出的钱多,谁就排在前列。
当然,还有其他逻辑。搜索引擎会用各种算法,剔除垃圾信息,将有价值的信息排在前列。
不过,第一种逻辑始终都是搜索引擎的核心,其他逻辑只能作为补充。
这个逻辑说起来很简单,但是实现起来却需要一点技术。毕竟互联网上面的信息是海量的,任何一项简单的操作,一旦涉及到海量数据,就变得复杂起来。
好在林潇潇现在已经
(本章未完,请点击下一页继续阅读)
『加入书签,方便阅读』