什么是全文检索
全文检索是指对于一个文本库中的每个文档,利用特定的搜索算法,在文本库中查找满足用户查询要求的所有文档的过程。
全文检索的原理是先将文本库中的所有文档进行分词处理,再将每个单词与文档库中的索引进行匹配,将匹配到的文档返回给用户。
全文检索的好处是可以根据关键词很快地找到想要的文档,节省用户的时间,提高用户的工作效率。
全文检索技术广泛应用于文本搜索引擎、电子商务网站商品搜索、企业内部信息检索、数字图书馆等领域。
同时,全文检索也需要考虑分词算法、索引结构、查询优化等技术问题。
全文检索是一种搜索技术,能够在大量文本数据中快速查找包含特定关键词或短语的文档。与传统的关键词搜索不同,全文检索不仅搜索文档的标题和摘要,还会搜索文档中的全部文本内容,从而提高搜索的准确性和可靠性。
在全文检索系统中,会将需要搜索的文档进行分词处理,将文本内容划分为一个个单独的词语或短语,然后将这些词语或短语建立索引。当用户输入关键词或短语时,全文检索系统会根据索引快速查找和匹配相关的文档,并返回搜索结果。
全文检索系统广泛应用于各种信息管理和搜索场景,如搜索引擎、电子邮件系统、文档管理系统、新闻资讯网站等。它可以有效地提高信息检索的效率和准确性,帮助用户快速找到所需的信息,提高工作效率和生产力。
SQL中with的用法
通用表达式在各个商业数据库中比如ORACLE,SQL SERVER等早就实现了,MySQL到了8.0 才支持这个特性。这里有两个方面来举例说明WITH的好处。
第一,易用性。
第二,效率。
举例一 WITH表达式的易用性
我们第一个例子, 对比视图的检索和WITH的检索。我们知道视图在MySQL里面的效率一直较差,虽说MySQL5.7 对视图做了相关固化的优化,不过依然不尽人意。考虑下,如果多次在同一条SQL中访问视图,那么则会多次固化视图,势必增加相应的资源消耗。MySQL里之前对这种消耗的减少只有一种,就是动态处理,不过一直语法较为恶心,使用不是很广。MySQL8.0后,又有了一种减少消耗的方式,就是WITH表达式。我们假设以下表结构:
有1000行测试记录。这里我们建立一个普通的视图:
检索语句A:对视图里的最大和最小值字段rank1进行过滤检索出符合条件的记录行数。我们用WITH表达式来重写一遍这个查询。查询语句B:
功能性演示, 索引表面上看执行时间差不多, 我们来对比下两条实现语句的查询计划,
A的计划:
B的计划:
从以上图我们可以看出,B比A少了一次对视图的固化,也就是说,不管我访问WITH多少次,仅仅固化一次。有兴趣的可以加大数据量,加大并发测试下性能。
举例二 WITH表达式的功能性
我们第二个例子,简单说功能性。
比如之前MySQL一直存在的一个问题,就是临时表不能打开多次。我们以前只有一种解决办法就是把临时表固化到磁盘,像访问普通表那样访问临时表。现在我们可以用MySQL8.0自带的WITH表达式来做这样的业务。
比如以下临时表:我们还是用之前的查询,这里会提示错误。现在我们可以用WITH来改变这种思路当然WITH的用法还有很多,感兴趣的可以去看看手册上的更深入的内容。