搜索引擎基本检索过程
1.构建文本库
在开发搜索功能前,一个搜索系统需要做些准备工作。首先必须构建一个文本的数据库。这个文本数据库用来保存所有用户可能检索的信息。在这些信息的基础上,确定检索系统中的文本模型。文本模型是被系统认可的一种信息格式,这种格式应当具有可识别,冗余程度低等特点。当然,在系统的运作过程中,文本数据库的信息可能会不断的变化。但是一旦文本模型确定下来之后,就不应当对其进行大的变动。
2.建立索引
在有了这种文本模型之后,就应该根据数据库内的文本,建立索引。索引可以达达提高信息搜索速度。目前,有许多建立索引的方式。采用哪种方式取决于信息检索系统的搜索引擎。对于大型信息检索系统来说,“倒排”是一种常见的建立索引的方式。
3.进行搜索
在为文档建立索引之后,就可以开始对其进行搜索。这是,通常都是有用户提交一个检索请求,该请求将被分析,然后利用文本操作进行处理。对于真是的信息检索系统,在处理查询请求前,还可以对请求进行一些预处理,然后再将请求送到后台,并返回给用户所需要的信息。
4.返回结果以前,对结果进行过滤
通常,在信息检索系统检索到用户需要的信息后,还要做一部操作。就是将信息以一定的规则进行排序或过滤。再返回给用户。这一步实际上关乎到用户的最终体验,如果总是将一些无关的信息返回给用户,那么它一定不是一个成功的信息检索系统。