目的:运用一定的技术手段将系统中的数据按一定的规则组织成为一个整体,使得用户能有效地对数据进行操作;
关键:数据仓库技术;
1.数据集成层次
定义:数据集成是将参与数据库的有关信息在逻辑上集成为一个属于异构分布式数据库的全局概念模式,以达到信息共享的目的。
层次:
1)基本数据集成:
通用标识符问题:隔离和调和;
数据丢失问题,:为丢失的数据产生一个非常接近实际的估计值来进行处理。
2)多级视图集成:两级映射
数据从局部数据库中,经过数据翻译、转换并集成为符合公共模型格式的中间视图;
进行语义冲突消除、数据集成和数据导出处理,将中间视图集成为综合视图。
3)模式集成
4)多粒度数据集成:异构数据集成中最难处理的问题,理想的多粒度数据集成模式是自动逐步抽象;数据综合、数据细化。
2.异构数据集成
1)异构数据集成的方法:过程式方法、声明式方法;
中间件集成异构数据库;
2)开放数据库互联标准
ODBC:开放式数据库互联OpenDatebaseConnectivity,是一种用来在数据库系统之间存取数据的标准应用程序接口,目前流行的数据库管理系统都提供了相应的ODBC驱动程序,它使数据库具有很好的开放性,数据格式转换也很方便。
基于XML的数据交换标准
3)异构数据集成的全局模式需要满足的条件
能够描述各种数据格式,无论其是结构化的还是半结构化的;
易于发布和进行数据交换,集成后的数据可以方便地以多种格式发布并便于在应用之间交换数据;
可以采用关系或对象数据模式为全局模式,但他们并不能很好地满足上述要求;
4)基于JSON的数据交换格式
在开发客户端与服务端的应用时,数据交换接口通常都是通过XML格式来进行数据交换的。