异构的数据源是大部分企业所面临的问题,数据集成,也就是在整合数据孤岛的同时,合并、净化和标准化数据成为企业数据管理领域面临的最主要问题之一。
通过SQL语句访问远程或异构数据库是集成数据的一种方式。除此之外,还包括以下几种方式:自定义接口将信息从一个应用程序传到另一个应用,这能够按照用户需求而精确实现,但创建和维护费用很大;数据库复制,很多产品提供能定期或持续地将整个数据库或数据库的一部分拷贝到另一个地点,复制非常简单,但除了拷贝之外没有处理数据的其他能力;ETL本身是用于创建数据仓库和数据集市,能够将数据从一个位置移到另外位置,并应用规则或表查询功能以某种方式连接或转换数据,ETL功能很强大但非常复杂;Web服务,包括XML标准在内的Internet协议所驱动的方式,用于完成独立的两个系统之间的数据交换,Web服务允许基于SQL的关系数据被作为XML数据来访问,也允许通过SQL访问本地XML,当应用之间是松耦合或无法用其他方式实现集成时非常有用。
当然,数据集成可以采用其中一种方式或以上多种方式进行组合。对于用户来说,不管采用何种方式集成数据,都面临很大的挑战,在整个过程中要非常谨慎地创建应用和数据之间的接口,以保障信息的精确度并满足不同终端用户的需求。