程序员人生 网站导航

数据库索引

栏目:数据库应用时间:2015-02-07 08:20:53

1、索引是甚么

索引是与表或视图关联的磁盘上结构,可以加快从表或视图中检索行的速度。索引包括由表或视图中的1列或多列生成的键。这些键存储在1个结构(B 树)中,使 SQL Server 可以快速有效地查找与键值关联的行。

> 1.1表或视图可以包括以下类型的索引:
  • 聚集 o 聚集索引根据数据行的键值在表或视图中排序和存储这些数据行。索引定义中包括聚集索引列。每一个表只能有1个聚集索引,由于数据行本身只能按1个顺序排序。 o 只有当表包括聚集索引时,表中的数据行才按排序顺序存储。如果表具有聚集索引,则该表称为聚集表。如果表没有聚集索引,则其数据行存储在1个称为堆的无序结构中。
  • 非聚集 o 非聚集索引具有独立于数据行的结构。非聚集索引包括非聚集索引键值,并且每一个键值项都有指向包括该键值的数据行的指针。 o 从非聚集索引中的索引行指向数据行的指针称为行定位器。行定位器的结构取决于数据页是存储在堆中还是聚集表中。对堆,行定位器是指向行的指针。对聚集表,行定位器是聚集索引键。 o 您可以向非聚集索引的叶级添加非键列以跳过现有的索引键限制(900 字节和 16 键列),并履行完全范围内的索引查询。

聚集索引和非聚集索引都可以是唯1的。这意味着任何两行都不能有相同的索引键值。另外,索引也能够不是唯1的,即多行可以同享同1键值。

每当修改了表数据后,都会自动保护表或视图的索引。

> 1.2索引和束缚

对表列定义了 PRIMARY KEY 束缚和 UNIQUE 束缚时,会自动创建索引。例如,如果创建了表并将1个特定列标识为主键,则 数据库引擎自动对该列创建 PRIMARY KEY 束缚和索引。有关详细信息,请参阅创建索引(数据库引擎)。

2、索引有甚么用

  • 与书中的索引1样,数据库中的索引使您可以快速找到表或索引视图中的特定信息。索引包括从表或视图中1个或多个列生成的键,和映照到指定数据的存储位置的指针。通过创建设计良好的索引以支持查询,可以显著提高数据库查询和利用程序的性能。索引可以减少为返回查询结果集而必须读取的数据量。索引还可以强迫表中的行具有唯1性,从而确保表数据的数据完全性。

  • 设计良好的索引可以减少磁盘 I/O 操作,并且消耗的系统资源也较少,从而可以提高查询性能。对包括 SELECT、UPDATE、DELETE 或 MERGE 语句的各种查询,索引会很有用。例如,在 AdventureWorks 数据库中履行的查询 SELECT Title, HireDate FROM HumanResources.Employee WHERE EmployeeID = 250。履行此查询时,查询优化器评估可用于检索数据的每一个方法,然后选择最有效的方法。可能采取的方法包括扫描表和扫描1个或多个索引(如果有)。

  • 扫描表时,查询优化器读取表中的所有行,并提取满足查询条件的行。扫描表会有许多磁盘 I/O 操作,并占用大量资源。但是,如果查询的结果集是占表中较高百分比的行,扫描表会是最为有效的方法。

  • 查询优化器使用索引时,搜索索引键列,查找到查询所需行的存储位置,然后从该位置提取匹配行。通常,搜索索引比搜索表要快很多,由于索引与表不同,1般每行包括的列非常少,且行遵守排序顺序。

  • 查询优化器在履行查询时通常会选择最有效的方法。但如果没有索引,则查询优化器必须扫描表。您的任务是设计并创建最合适您的环境的索引,以便查询优化器可以从多个有效的索引当选择。SQL Server 提供的数据库引擎优化顾问可以帮助分析数据库环境并选择适当的索引。

3、索引的优势

第1,通过创建唯1性索引,可以保证数据库表中每行数据的唯1性。 第2,可以大大加快 数据的检索速度,这也是创建索引的最主要的缘由。 第3,可以加速表和表之间的连接,特别是在实现数据的参考完全性方面特别成心义。 第4,在使用分组和排序 子句进行数据检索时,一样可以显著减少查询中分组和排序的时间。 第5,通过使用索引,可以在查询的进程中,使用优化隐藏器,提高系统的性能。

4、索引既然这么有优势,为何不每列都创建

第1,创建索引和保护索引要耗费时间,这类时间随着数据 量的增加而增加。 第2,索引需要占物理空间,除数据表占数据空间以外,每个索引还要占1定的物理空间,如果要建立聚簇索引,那末需要的空间就会更大。 第3,当对表中的数据进行增加、删除和修改的时候,索引也要动态的保护,这样就下降了数据的保护速度。

5、 创建索引的1些策略

  • 在常常需要搜索的列上,可以加快搜索的速度;
  • 在作为主键的列上,强迫该列的唯1性和组织表中数据的排列结构;
  • 在常常用在连接的列上,这 些列主要是1些外键,可以加快连接的速度;
  • 在常常需要根据范围进行搜索的列上创建索引,由于索引已排序,其指定的范围是连续的;
  • 在常常需要排序的列上创 建索引,由于索引已排序,这样查询可以利用索引的排序,加快排序查询时间;
  • 在常常使用在WHERE子句中的列上面创建索引,加快条件的判断速度。

一样,对有些列不应当创建索引。

  • 第1,对那些在查询中很少使用或参考的列不应当创建索引。这是因 为,既然这些列很少使用到,因此有索引或无索引,其实不能提高查询速度。相反,由于增加了索引,反而下降了系统的保护速度和增大了空间需求。
  • 第2,对那 些只有很少数据值的列也不应当增加索引。这是由于,由于这些列的取值很少,例如人事表的性别列,在查询的结果中,结果集的数据行占了表中数据行的很大比 例,即需要在表中搜索的数据行的比例很大。增加索引,其实不能明显加快检索速度。
  • 第3,对那些定义为text, image和bit数据类型的列不应当增加索引。这是由于,这些列的数据量要末相当大,要末取值很少。
  • 第4,当修改性能远远大于检索性能时,不应当创建索 引。这是由于,修改性能和检索性能是相互矛盾的。当增加索引时,会提高检索性能,但是会下降修改性能。当减少索引时,会提高修改性能,下降检索性能。因 此,当修改性能远远大于检索性能时,不应当创建索引。

6、创建索引的方法

创建索引有多种方法,这些方法包括直接创建索引的方法和间接创建索引的方法。
  • 直接创建索引,例如使用CREATE INDEX语句或使用创建索引向导
  • 间接创建索引,例如在表中定义主键束缚或唯1性键束缚时,同时也创建了索引。

    虽然,这两种方法都可以创建索引,但 是,它们创建索引的具体内容是有区分的。

    使用CREATE INDEX语句或使用创建索引向导来创建索引,这是最基本的索引创建方式,并且这类方法最具有柔性,可以定制创建出符合自己需要的索引。在使用这类方式 创建索引时,可使用许多选项,例如指定数据页的充满度、进行排序、整理统计信息等,这样可以优化索引。使用这类方法,可以指定索引的类型、唯1性和复合 性,也就是说,既可以创建聚簇索引,也能够创建非聚簇索引,既可以在1个列上创建索引,也能够在两个或两个以上的列上创建索引。 通过定义主键束缚或唯1性键束缚,也能够间接创建索引。主键束缚是1种保持数据完全性的逻辑,它限制表中的记录有相同的主键记录。在创建主键束缚时,系 统自动创建了1个唯1性的聚簇索引。虽然,在逻辑上,主键束缚是1种重要的结构,但是,在物理结构上,与主键束缚相对应的结构是唯1性的聚簇索引。换句话 说,在物理实现上,不存在主键束缚,而只存在唯1性的聚簇索引。一样,在创建唯1性键束缚时,也同时创建了索引,这类索引则是唯1性的非聚簇索引。因此, 当使用束缚创建索引时,索引的类型和特点基本上都已肯定了,由用户定制的余地比较小。

当在表上定义主键或唯1性键束缚时,如果表中已有了使用CREATE INDEX语句创建的标准索引时,那末主键束缚或唯1性键束缚创建的索引覆盖之前创建的标准索引。也就是说,主键束缚或唯1性键束缚创建的索引的优先 级高于使用CREATE INDEX语句创建的索引。

7、索引的特点

索引有两个特点,即唯1性索引和复合索引。
  • 唯1性索引保证在索引列中的全部数据是唯1的,不会包括冗余数据。如果表中已有1个主键束缚或唯1性键束缚,那末当创建表或修改表时,SQL Server自动创建1个唯1性索引。但是,如果必须保证唯1性,那末应当创建主键束缚或唯1性键束缚,而不是创建1个唯1性索引。当创建唯1性索引 时,应当认真斟酌这些规则:当在表中创建主键束缚或唯1性键束缚时,SQL Server自动创建1个唯1性索引;如果表中已包括有数据,那末当创建索引时,SQL Server检查表中已有数据的冗余性;每当使用插入语句插入数据或使用修改语句修改数据时,SQL Server检查数据的冗余性:如果有冗余值,那末SQL Server取消该语句的履行,并且返回1个毛病消息;确保表中的每行数据都有1个唯1值,这样可以确保每个实体都可以唯1确认;只能在可以保证实体 完全性的列上创建唯1性索引,例如,不能在人事表中的姓名列上创建唯1性索引,由于人们可以有相同的姓名。

  • 复合索引就是1个索引创建在两个列或多个列上。在搜索时,当两个或多个列作为1个关键值时,最好在这些列上创建复合索引。当创建复合索引时,应当斟酌 这些规则:最多可以把16个列合并成1个单独的复合索引,构成复合索引的列的总长度不能超过900字节,也就是说复合列的长度不能太长;在复合索引中,所 有的列必须来自同1个表中,不能跨表建立复合列;在复合索引中,列的排列顺序是非常重要的,因此要认真排列列的顺序,原则上,应当首先定义最唯1的列,例 如在(COL1,COL2)上的索引与在(COL2,COL1)上的索引是不相同的,由于两个索引的列的顺序不同;为了使查询优化器使用复合索引,查询语 句中的WHERE子句必须参考复合索引中第1个列;当表中有多个关键列时,复合索引是非常有用的;使用复合索引可以提高查询性能,减少在1个表中所创建的 索引数量。

------分隔线----------------------------
------分隔线----------------------------

最新技术推荐