随着信息技术的应用在企业内部的不断深化,与外部越来越强烈,迫切需要整合和共享信息的现有信息,中国“信息孤岛”的企业信息有了交换的需求,数据集成也在这时出现了。
数据源彼此独立、相互封闭,使得相关数据分析难以在系统发展之间文化交流、共享和融合,从而形成了“信息孤岛“。数据集成在目前在企业中,由于技术开发时间或开发管理部门的不同,往往有多个异构的、运行在进行不同的软硬件平台上的信息网络系统可以同时经济运行。
数据集成,其前提是被集成应用发展必须公开数据产业结构,即必须公开表结构,表间关系,编码的含义等,数据信息集成可以通过技术应用间的数据交换从而能够达到集成,主要研究解决这些数据的分布性和异构性的问题。
数据源的异质性一直是困扰众多数据集成系统的核心问题,也是数据集成中的一个热点话题。语法异构一般指源数据和目的进行数据发展之间命名规则及数据类型企业存在一些不同,数据集成的困难主要异质性在语法和语义异构异质性。
对于数据库,命名是指表和字段名。数据集成的语法异构相对比较简单,只要我们实现信息字段到字段、记录到记录的映射,解决问题其中的名字冲突和数据技术类型冲突。这种映射非常直接,易于实现。因此,数据集成不关心语法异构内容和数据的含义,只要你知道的数据结构信息,完整的源数据结构上的数据结构的目的之间的映射。
数据集成的语义异构要比语法异构复杂的多,它往往是我们需要进行破坏字段的原子性,即需要通过直接处理相关数据分析内容,当数据进行集成要考虑企业数据的内容和含义时,就进入到一个语义信息异构的层次上。
常见的语义异构系统包括通过以下进行一些生活方式:字段拆分、字段合并、字段数据显示格式变换、记录间字段转移等。数据集成的语法和多相异质差的语义可以追溯到在数据源的差异时建模。
实体关系模型时数据源是相同的,只是不一样的命名规则,导致只有异构数据源之间的语法;当构建实体模型当数据源,数据集成使用不同的颗粒尺寸分,不同的实体和不同语义表示场数据之间的关系,将不可避免地语义异构数据源之间产生,数据集成会解决这个很大的麻烦。
版权声明:本文为Yun88网的原创文章,转载请附上原文出处链接及本声明。
更多产品了解
欢迎扫码加入云巴巴企业数字化交流服务群
产品交流、问题咨询、专业测评
都在这里!
2022-11-22 16:52:59
2022-03-31 19:55:28
2022-11-22 16:53:14
2022-11-22 16:52:52
2022-09-08 13:34:26
甄选10000+数字化产品 为您免费使用
申请试用
评论列表