返回第九十六章 林总去哪了(上)  这个宗主太腹黑了首页

关灯 护眼     字体:

上一页 目录 下一页

    第九十六章 林总去哪了(上) (第2/3页)

牛相信自己。毕竟,像这种高级人才一般是不缺钱的,他们更需要的是理解自己的人,是实现自己的理想和抱负。除了另一位技术大牛,普通人很难用好这种人,因为没有共同语言,交流不来。

    这个逻辑,并不适应于那些成熟的行业,但对于高新技术行业是适用的。

    因此,林潇潇创业计划的第一件事情不是注册公司、不是找志同道合的伙伴,而是学习。

    搜索引擎的概念已经被提出来,相关的论文发表了不少,只是还没有进入大众视野。

    林潇潇花了一些钱将相关的论文都搜集起来,一边学习,一边自己研究。

    搜索引擎的实现,首先需要遍历整个网络。

    这个不算多难,写一个爬虫程序,用递归算法,不断地抓取网页即可。网页和网页之间都是互相链接的,极少有网页会孤立存在。只要爬虫运行一定时间,是可以访问到绝大部分网页的。

    其次需要建立索引。每抓取一个网页都要精简为纯文字信息,建立索引,存入数据库。

    最后才是搜索,根据关键字,首先搜索数据库,将相关信息进行排名,最后显示相关网页。

    这个排名就是搜索引擎算法的关键。只有把用户最想搜到的信息排在前列,这个搜索引擎才有价值。

    林潇潇大致知道前世某搜索引擎的排名原理。其核心逻辑是:一个网页被其他网页引用的次数越多,那么它就越有价值,就越需要被排在前列。

    还有另一种逻辑:对关键字进行明码标价,谁出的钱多,谁就排在前列。

    当然,还有其他逻辑。搜索引擎会用各种算法,剔除垃圾信息,将有价值的信息排在前列。

    不过,第一种逻辑始终都是搜索引擎的核心,其他逻辑只能作为补充。

    这个逻辑说起来很简单,但是实现起来却需要一点技术。毕竟互联网上面的信息是海量的,任何一项简单的操作,一旦涉及到海量数据,就变得复杂起来。

    好在林潇潇现在已经

    (本章未完,请点击下一页继续阅读)

『加入书签,方便阅读』

上一页 目录 下一页