SQL中的全文检索

zjcxc 元老 2004-08-21 10:49:44
最近搜索了一下全文检索,发现了一些问题,现在总结如下:

全文索引和查询概念(摘自SQL 联机帮助)

全文索引、查询和同步化最主要的设计要求是,在注册进行全文检索的所有表上都有一个唯一的全文键列(或者单列主键)。全文索引对使用的重要字及其所在位置进行跟踪。

例如,假定有一个对 DevTools 表的全文索引。全文索引可能指出在 Abstract 列的第 423 个和第 982 个单词处找到了单词 Microsoft,所在的行与 ProductID 6 关联。该索引结构支持对所有包含被索引单词的项进行有效检索,以及高级检索操作,如短语检索和邻近检索。

为防止全文索引因包含很多对检索没有帮助的词而变得臃肿,a、and、is 或 the 这类额外的词都忽略不计。例如,指定"the products ordered during these summer months"与指定"products ordered during summer months"是一样的。有这两个字符串的行都会被返回。

目录 \Mssql\Ftdata\Sqlserver\Config 下提供了多种语言的干扰词列表。在安装带有全文检索支持的 Microsoft® SQL Server™ 时会创建这个目录,并同时安装干扰词文件。干扰词文件可以编辑。例如,高技术公司的系统管理员可以把单词 computer 添加到他们的干扰词表中去。(如果编辑干扰词文件,则必须在更改生效之前重新填充全文目录。)下表显示了干扰词文件及其相应的语言。

干扰词文件 语言
-------------- ---------
Noise.chs 简体中文
Noise.cht 繁体中文
Noise.dat 语言中性
Noise.deu 德语
Noise.eng 英语(英国)
Noise.enu 英语(美国)
Noise.esn 西班牙语
Noise.fra 法语
Noise.ita 意大利语
Noise.jpn 日语
Noise.kor 韩文
Noise.nld 荷兰语
Noise.sve 瑞典语


在处理全文查询时,检索引擎将满足检条件的行的键值返回给 Microsoft SQL Server。比如有一个 SciFi 表,其中 Book_No 列是主键列。

Book_No Writer Title
-------- ----------- --------------------------
A025 Asimov Foundation's Edge
A027 Asimov Foundation and Empire
C011 Clarke Childhood's End
V109 Verne Mysterious Island


假定想使用一个全文检索查询来查找包含单词 Foundation 的书名。在本例中,将从全文索引获得值 A025 和 A027。然后 SQL Server 用这些键值和其它栏的信息响应该查询。

下表显示了存储全文索引数据所使用的语言。这些语言基于 SQL Server 安装期间选择的 Unicode 排序规则区域设置标识符。

Unicode 排序规则区域设置标识符 全文数据存储所用的语言
------------------------------- -----------------------
中文注音符号(台湾) 繁体中文
汉语拼音 简体中文
中文笔画 简体中文
中文笔画(台湾) 繁体中文
荷兰语 荷兰语
英语(英国) 英语(英国)
法语 法语
通用 Unicode 英语(美国)
德语 德语
德文电话簿 德语
意大利语 意大利语
日语 日语
日语 Unicode 日语
韩文 韩文
韩文 Unicode 韩文
西班牙语(现代) 西班牙语
瑞典/芬兰语 瑞典语



此列表中没有的其它所有 Unicode 排序规则区域设置标识符值都映射到使用空格分隔单词的中性语言单词的断字符和词干分隔符。

说明 Unicode 排序规则区域设置标识符设置用于所有可进行全文索引的数据类型(如 char、nchar 等)。如果为 char、varchar 或 text 类型列的排序次序设置的语言类型,不是 Unicode 排序规则区域设置标识符语言,那么在对 char、varchar 和 text 类型的列进行全文索引和查询时,仍然使用 Unicode 排序规则区域设置标识符值。

...全文
3221 点赞 收藏 46
写回复
46 条回复
切换为时间正序
当前发帖距今超过3年,不再开放新的回复
发表回复
xwqjamky 2005-09-07
收藏
回复
kiddallen 2005-08-30
sql server的全文检索精确度如何?
回复
kebeixueng 2005-08-25
学习
回复
dofine 2005-07-10
shoucang
回复
fzxml 2005-05-25
mark
回复
qpl007 2005-05-16
收藏
回复
飞行的兔子 2005-04-25
好东西,mark一下!
回复
winternet 2005-04-25
收藏了!
回复
coolnick 2005-04-25
mark
回复
fzxml 2005-04-22
mark
回复
lwqi 2005-02-27
收藏先
回复
poonzsp 2005-02-22
mark
回复
gengxl 2005-01-11
mark
回复
iswear428 2005-01-10
学习到
回复
pclogic 2004-12-10
mark
回复
laihua 2004-12-08
收藏
回复
newabby 2004-11-17
mark
回复
wozhuchuanwei 2004-10-22
还有,那些情况下建立“全文检索”适合呀?
回复
wozhuchuanwei 2004-10-22
收藏!
回复
老宛 2004-08-31
哇,刚上来,收藏先!
回复
加载更多回复
相关推荐
发帖
MS-SQL Server
创建于2007-09-28

3.3w+

社区成员

MS-SQL Server相关内容讨论专区
申请成为版主
帖子事件
创建了帖子
2004-08-21 10:49
社区公告
暂无公告