admin

在SQL中按子字符串查找字符串的最快方法?

sql

我有2列的大型表格:Id和Title。ID为bigint,我可以自由选择“标题”列的类型:varchar,char,text等。列标题包含随机文本字符串,例如“
abcdefg”,“ q”,“ allyourbasebelongtous”,最多255个字符。

我的任务是通过给定的子字符串获取字符串。子字符串也具有随机长度,可以是字符串的开头,中间或结尾。最明显的执行方式:

SELECT * FROM t LIKE '%abc%'

我不在乎INSERT,只需要进行快速选择即可。我该怎么做才能尽快执行搜索?

我使用的是MS SQL Server 2008 R2,据我所知,全文搜索将毫无用处。


阅读 119

收藏
2021-05-10

共1个答案

admin

如果您要使用比Randy答案少的空间,并且数据中存在大量重复,则可以创建N-
Ary树数据结构,其中每个边都是下一个字符,然后在数据中悬挂每个字符串和结尾的子字符串。

您按深度优先顺序对节点进行编号。然后,您可以为每个记录创建一个最多包含255行的表,并带有记录的ID和树中与字符串或尾随子字符串匹配的节点ID。然后,当您执行搜索时,会找到代表要搜索的字符串(以及所有尾随子字符串)的节点ID,并进行范围搜索。

2021-05-10