数据仓库是一个面向主题的集成的相</p>
对稳定的反映历史变化的数据集合y用于支持管理决策</p>
面向主题</p>
2集成</p>
3相对稳定</p>
4反映历史变化</p>
数据库是面向事务的设计y数据仓库是面向主题设计的数据库</p>
一般存储在线交易数据y数据仓库存储的一般是历史数据数据</p>
库是为捕获数据而设计y数据仓库是为分析数据而设计的。</p>
一个典型的数据仓库系统通常包含数据源数据存储和管理</p>
olap服务器前端工具和应用等四个部分。</p>
数据源x是数据仓库的基础系统的数据来源y包含企业的各种内部数</p>
据和外部数据内部数据包括存在于oltp系统中的各种业务数据和办</p>
公自动化系统中的各类文档数据外部数据包括各类法律法规市场信</p>
息竞争对手信息及各类外部统计数据和其他相关文档等。</p>
数据存储和管理x是数据仓库系统的核心是指在各业务系统基础上周</p>
期性地对数据进行抽取按照主题进行重新组织y最终确定数据仓库的物理存储结构y同</p>
时存储数据仓库的各种元数据?数据字典记录系统定义数据转换规</p>
则数据加载频率及业务规则等?对数据仓库系统的管理y就是对相</p>
应数据库系统的管理y通常包括数据的安全归档备份维护和恢复</p>
等工作。</p>
olap服务器x联机分析处理服务器将需要分析的数据按照多维数据模</p>
型进行重组y以支持用户随时多角度多层次进行数据分析y发现数据</p>
规律与趋势</p>
前端工具和应用x数据查询工具自由报表工具数据分析工具数据</p>
挖掘工具和各类应用系统。</p>
实时主动数据仓库是一个集成的信息存储仓库y既具备批量和周期性的数据</p>
加载能力?采用etl技术?y也具备数据变化的实时探测传播和加载能力</p>
?采用cdc技术?y并能结合历史数据和新颖数据实现查询分析和自动规则</p>
触发y从而提供对战略决策和战术决策的双重支持。</p>
数据整合。</p>
不同数据源的数据被物理地集成到数据目标</p>
利用etl工具把数据源中的数据批量地加载到数据仓库就属于数据整</p>
合。</p>
数据联邦。</p>
在多个数据源的基础上建立统一的逻辑视图y对外界应用屏蔽数据</p>
在各个数据源的分布细节</p>
对应用而言y只有一个数据访问入口y但事实是被请求的数据只是</p>
逻辑上的集中y物理上仍然分布在各个数据源中</p>
只有收到请求时y数据仓库才临时从不同数据源获取相关数据y进</p>
行集成后提交给数据请求者。</p>
数据传播。</p>
数据在多个应用之间传播</p>
在企业应用集成解决</p>
方案中y不同应用之间可以通过传播消息进行交互</p>
4混合方式</p>
对那些不同应用都使用的数据采用数据整合的方式进行集成y而对</p>
那些只有特定应用才使用的数据则采用数据联邦方式进行集成。</p>
有多种技术可以为实时主动数据仓库提供数据集成服务y比如脚本etl</p>
eai和cdc但是y只有部分技术能提供实时(连续)的数据集成x</p>
?</p>
1?脚本脚本是数据集成的一种快速解决方案y其优点是y使用灵活且比</p>
较经济y很容易着手开发和进行修改y几乎任何操作系统和绝大部分dbms都</p>
可以使用脚本但是y使用脚本也有很多问题y比如y耗费开发者的时间和</p>
精力y不好管理和操作y以及不能满足服务水平协议?</p>
等等。</p>
有多种技术可以为实时主动数据仓库提供数据集成服务y比如脚本etl</p>
eai和cdc但是y只有部分技术能提供实时(连续)的数据集成x</p>
?</p>
2?etletl是实现大规模数据初步加载的理想解决方案y它提供了高级</p>
的转换能力etl任务通常都是在 维护时间窗口进行y在etl任务执行期间y</p>
数据源默认不会发生变化y这就使得用户不必担忧etl任务开销对数据源的影</p>
响y但同时也意味着y对于商务用户而言y数据和应用并非任何时候都是可</p>