程序员人生 网站导航

性能问题损伤SQL Server 2008的全文检索

栏目:Sqlserver时间:2014-03-08 02:19:46
首先,一些不熟悉全文检索背景的人。一般来说,计算机科学术语全文检索只是意味着你在文档中搜索所有的文本。对付全文检索的另一种选择是查找元数据,例如标题和关键字。

  对SQL Server而言,全文检索提供了存储在关系数据库或者是文件系统上的文本的高级搜索能力。搜索并不局限于字符串,应用程序所能理解的例如词干分析。这使得搜索“swim”,也返回“swims”, “swimming”,和“swam”。它也可以支持权重搜索,即某些词比其他的词更重要,并可以搜索两个彼此相邻的词语。根据搜索条件的结果可以进行一个排名。

  之前版本的全文检索是一个外部服务,和SQL Server并排运行的服务。这样设计,参与索引的表和列的数据不得不从SQL Server运送到全文检索服务。全文检索编目不能与其他的数据库一起备份,而且两个服务不能轻松的共享内存和CPU资源。

  为了处理这些和其他的问题,SQL Server 2008把全文检索移到数据库中。现在SQL Server自身可以动态管理服务器资源,为服务自动管理改变内存和CPU资源配额。不幸的是,开发人员遇到了这种设计的一些意外结果。

  他们依然会碰到的特定问题是事务。在一个事务性的数据库中,SQL Server要时刻遵守ACID的规则。这意味着在搜索的时候行、页或甚至整个表都被锁定。通常情况下不会太坏,但是Brent Ozar解释说,错误的搜索会让事情变得复杂。

  如果你在修正版(Revisions)上进行全文检索并且包含一些常见的关键字,像SQL滞留,则需要匹配数以万计的记录。当我们查看一下查询计划的时候,我们看到有50-100k的读操作。在表里面做这样的事情,也会获得沉重的表插入,事务性的灾难。

  Jeff Attwodd继续说道。

------分隔线----------------------------
------分隔线----------------------------

最新技术推荐