您好,欢迎来到佳博论文网!

搜索引擎的开发与实现

字数:13773,页数:29 论文编号:TX115

前言

面对浩瀚的网络资源,搜索引擎为所有网上冲浪的用户提供了一个入口,毫不夸张的说,所有的用户都可以从搜索出发到达自己想去的网上任何一个地方。

作为近年来互联网发展的热点之一,搜索引擎受到各方面的关注。可以想象如果离开了搜索引擎的帮助,使用者能够涉猎的互联网范围无疑将被大大限制。

搜索引擎一词在国内外因特网领域被广泛使用,然而他的含义却不尽相同。在美国搜索引擎通常指的是基于因特网的搜索引擎,他们通过网络机器人程序收集上千万到几亿个网页,并且每一个词都被搜索引擎索引,也就是我们说的全文检索。著名的因特网搜索引擎包括First Search、Google、HotBot等。在中国,搜索引擎通常指基于网站目录的搜索服务或是特定网站的搜索服务。

目录

目录 1

前言 3

第一章 绪论 4

1.1开发背景 4

1.2搜索引擎发展现状 5

1.3课题的主要内容 5

第二章 搜索引擎的概况与分析 6

2.1搜索引擎分类 7

2.1.1全文搜索引擎 7

2.1.2目录索引 7

2.1.3元搜索引擎 7

2.2搜索引擎的结构 7

2.2.1 Robot爬行程序 8

2.2.2索引模块 8

2.2.3 搜索模块 10

2.3垂直搜索引擎技术 10

2.3.1垂直搜索引擎 11

2.3.2 垂直搜索的划分 11

2.3.3垂直搜索引擎的相关技术 11

2.4小结 12

第三章 正则表达式 13

3.1起源 13

3.2定义 13

3.3使用 14

3.3.1 正则表达式的组成 14

3.3.2正则表达式的运用 17

3.4小结 19

第四章 系统的设计与开发 19

4.1 系统概述 20

4.2 有向Robot技术 20

4.2.1搜索Robot 20

4.2.2挖掘Robot 20

4.2.3收集Robot 21

4.3索引器 21

4.3.1中文分词技术 21

4.3.2 建立标引库 23

4.4 网页的分析提取 23

4.4.1网页内容的提取 23

4.4.2网页分析 25

4.5 数据表 26

4.6 交互界面 26

4.7 小结 26

结束语 27

参考文献 28

致谢 29

搜索引擎的开发与实现......