一直以来,对数据库只是会用,很少系统的学习过,很多概念知道但是不是很熟悉。
索引--可以加快搜索速度。这是我脑子里面的概念,可是SQL Server中索引有聚类索引(CLUSTERED)和非聚类索引。我数据表一般有ID字段,我就自然把它设置成了主键;而SQL Server会将主键设置为聚类索引,很多情况下,这是一种性能损失!!
1. SQL Server联机丛书中的介绍
根据数据库的功能,可在数据库设计器中创建三种类型的索引 — 唯一索引、主键索引和聚集索引。
提示 尽管唯一索引有助于找到信息,但为了获得最佳性能,建议使用主键约束或唯一约束。有关这些约束的更多信息,请参见主键约束和唯一约束。
唯一索引
唯一索引不允许两行具有相同的索引值。
主键索引
数据库表通常有一列或列组合,其值用来唯一标识表中的每一行。该列称为表的主键。
在数据库关系图中为表定义一个主键将自动创建主键索引,主键索引是唯一索引的特殊类型。主键索引要求主键中的每个值是唯一的。当在查询中使用主键索引时,它还允许快速访问数据。
聚集索引
在聚集索引中,表中各行的物理顺序与键值的逻辑(索引)顺序相同。表只能包含一个聚集索引。
如果不是聚集索引,表中各行的物理顺序与键值的逻辑顺序不匹配。聚集索引比非聚集索引有更快的数据访问速度。
2. 聚集索引和非聚集索引
可考虑将聚集索引用于:
包含数量有限的唯一值的列,如 state 列只包含 50 个唯一的州代码。
使用下列运算符返回一个范围值的查询:BETWEEN、>、>=、< 和 <=。
返回结果集查询。
数据表中的记录按照聚集索引排列的,所以将大规模查询的字段定义成聚类索引,能大大的提高性能!
3. 实际例子
如表结构TB_NEWS:四个字段
ID uniqueidentifier(16)
NewsTitle varchar(200)
NewContent Text(16)
InsertDate smallDateTime(8)
-----------------------------------------------------------------------------
按照习惯,将表的字段设置后,顺手将主键设置为ID,这样做的后果就是:数据库自动为ID建立聚类索引。对于网站新闻,最主要的查询操作,查询按照时间段。典型的查询是
select ID, NewsTitle, NewContend, InsertDate
from TB_NEWS
where InsertDate between @DataTime1 and @DataTime2
在一个有大于105条数据的表中查询效率明显不高。数据表中记录存放竟然按照uniqueidentifier这样无序的东西存放,简直是资源浪费啊,查询将遍历所有记录,后果可想而知。用InsertDate 作聚类索引,查询速度绝对可以,InsertDate字段不会被修改,所以受影响的仅仅是插入数据操作。
单条的查询可以这样写:和只用ID的查询,不知道哪个更快:)可以测试一下,呵呵
select ID, NewsTitle, NewContend, InsertDate
from TB_NEWS
where InsertDate = @DataTime and ID= @ID
我觉得方法应该是:
1.设计表
2. 输入字段类型
3. 选择合适字段建立 聚类索引
4. 使用ID建立主键
分享到:
相关推荐
微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引)。
实际上,您可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引)
基于SQL选择语句的聚类分析 (1).pdf
实验一 Microsoft SQL Server Analysis Services的使用 3 实验二 使用WEKA进行分类与预测 15 实验三 使用WEKA进行关联规则与聚类分析 22 实验四 数据挖掘算法的程序实现 28
该方法的特色在于:使用潜在语义索引计算句子的相似度,并将层次聚类算法和K - 中心聚类算法相结合进行句子聚 类,这样提高了句子相似度计算和主题划分的准确性,有利于生成的文摘在全面覆盖文档主题的同时减少自身的...
heart-disease的SQL2005数据挖掘分析之聚类分析的全部资料
包含四个数据集,分别从english20newsgroup、reuters 中提取,分别为500条记录,各含五类,每类文档数目...从两个母数据库中提取,存储为sqlserver2008格式,可以直接附加,表结构如下!全部进行了标注,可以用来分类或者聚类!
微软的SQLSERVER提供了两种索引:聚集索引(clusteredindex,也称聚类索引、簇集索引)和非聚集索引(nonclusteredindex,也称非聚类索引、非簇集索引)。下面,我们举例来说明一下聚集索引和非聚集索引的区别: ...
基于SQL选择语句的聚类分析.pdf
arcgis server flex开发:WeightedClusterer聚类和GridClusterer聚类的用法, 效果不同。在地图上点击,每点击一次都增加一个点,这些点聚类时使用两种不同的方法效果差别很明显。
实际上,您可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引)。
基于混合聚类的静态空间数据索引分析,靳雅,杨永国,R树索引结构是目前公认的针对空间数据的索引结构,它适合动态索引,而专用于静态空间数据环境下的索引结构较少。静态空间数据组�
提出了一种自动根据对象的数量确定间隔的距离和聚类的数量的聚类方法,合理地将对象进行聚类划分,并将聚类的结果构建Hilbert R-tree索引,通过实验表明算法在建立时间和其他性能上均优于传统的Hilbert R-tree索引。
介绍数据挖掘的定义、在BI中所处的位置和一般流程,简要介绍在SQL SERVER 2005中常用的算法和一般应用;通过对保险行业的数据建模,对客户将买什么险种进行预测以及各险种的关联程度分析这个实例,介绍在VS中建立...
微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引)……
聚类分析是研究多要素事物分类问题的数量方法。基本原理是根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,...常见的聚类分析方法有系统聚类法、动态聚类法和模糊聚类法等。
对常见的聚类性能的度量标准进行了梳理,总结了优缺点、对应的python实现方式,通过表格化的形式,方便展现不同度量标准之间的差异,。
MYDBSCAN:基于密度的聚类DBSCAN(Density-Based Spatial Clustering of Applications with Noise)...MYCFSFDP:基于划分和密度的聚类CFSFDP(Clustering by fast search and find of density peaks)算法的底层实现