通过SQL 2008管理非结构化数据
通过SQL Server 2008管理非结构化数据
SQL Server 技术文档
作者:Graeme Malcolm (内容主管)
技术审核员:Shan Sinha
项目编辑:Joanne Hodgins
发布日期:2007年8月
适用产品:SQL Server 2008
概述:数字化信息的增长为企业应当存储和访问业务数据的方法提供了启发。数据库作为业务应用程序的核心,必须能够同非结构化的数据进行集成,其中包括文档、图像、视频、以及其它多媒体格式。为了能够对信息生命周期进行管理,满足策略需求,并实施内容管理解决方案,企业需要存储和管理所有格式的数字化数据。
Microsoft SQL Server™ 2008提供了一套灵活的解决方案,对非结构化数据进行存储并将其同关系型数据相结合,从而围绕企业中的全部数据来构建一套全面的解决方案。
版权
该白皮书为初步文档,可能会在所述软件进行最后商业发布之前做完全修改。
本文档所包含的信息代表了在发布之日,Microsoft Corporation(微软公司)对所讨论问题的当前看法。因为Microsoft必须顺应不断变化的市场条件,故不应将本文档理解为Microsoft一方的承诺,Microsoft不保证所给出的信息在发布之日以后的准确性。
本白皮书仅用于提供信息。Microsoft对本文档中的信息不做任何明示、默示或法定的担保。
遵守所有适用的版权法律是用户的责任。在不对版权法所规定的权利加以限制的情况下,未得到Microsoft Corporation明确的书面许可,不得为任何目的、以任何形式或手段(电子的、机械的、影印、录制等等)复制、传播本文的任何部分,也不得将其存储或引入到检索系统中。
本文档可能涉及Microsoft的专利、专利申请、商标、版权或其它知识产权。除非Microsoft通过书面许可协议明确提供,此文档并没有授予您对这些专利、商标、版权或其它知识产权的任何许可。
除非特别说明,此处所述作为范例的公司、组织、产品、域名、电子邮件地址、徽标、人员、地点和事件均为虚构,不与任何真实的公司、组织、产品、域名、电子邮件地址、徽标、人员、地点或事件有任何联系,也不应据此进行任何臆测或推断。
Ó 2007 Microsoft Corporation. 保留所有权利。
Microsoft, Excel, SQL Server, 以及Windows是Microsoft Corporation在美国和/或其它国家的注册商标或商标。
所有其它商标均是其各自所有者的财产。
目录
导言 1
非结构化数据的商业动力 1
非结构化数据面临的挑战 1
存储非结构化数据的挑战 2
使用非结构化数据的挑战 2
在SQL Server 2008中的非结构化数据的目标 2
在SQL Server 2008中存储非结构化数据 2
SQL Server BLOB 3
FILESTREAM 属性 3
远程BLOB存储API 3
比较BLOB的存储选择 4
在SQL Server 2008中搜索非结构化数据 4
集成全文搜索 5
结论 5
导言
最近几年,个人和公司创建及存储的数字化数据急剧膨胀。过去,企业使用计算机系统和数据库以结构化格式(例如关系表或固定的格式文档)来存储大部分商业数据,软件应用程序使用这些结构化数据来执行商业任务。然而如今,公司的很大一部分数据存储在使用功能强大的工具(例如Microsoft® Office Excel®和Microsoft Office Word)所创建的文档中,而数字照片、文档扫描、视频产品和音频格式进一步的扩大了用于商业数据的非结构化数据格式的范围。此外,存储硬件和内存的成本显著降低,也极大的影响了计算机中所存储的数据的数量和类型,并导致新一代的商业应用的产生,这些商业应用合并了传统的关系型数据结构和非结构化数字内容。数字内容的丰富意味着公司现在正试图在企业范围内管理关系型数据和非结构化数据,并需要一个能够全面满足关系型数据存储和非关系型数据存储,同时降低对这些应用程序进行管理和创建成本的解决方案。
例如,考虑一个保险索赔应用程序在过去的15年里是怎样改变的。15年前,这个应用程序一般维护一列以简单的行和列来存储的保险索赔记录。而今天,一个保险索赔应用程序更趋向于管理一组包括图片、照片和文档的索赔记录。它还可能需要以基于XML的格式来显示索赔数据,以此来与其它的系统集成,并且它还可能包括更高级别的功能,例如空间可视化、报表和分析。
SQL Server 2008提供了一些超出传统的数据库系统功能,并趋向于提供能够存储、管理和查询所有类型数据(包括非结构化二进制数据、XML和空间数据)的数据平台。这篇白皮书集中讲述了非结构化数据,并描述了SQL Server 2008中存储、管理和使用非结构化数据的选项。
------分隔线----------------------------
------分隔线----------------------------