数据融合

全/面/洞/察

数据关联整合服务

服务概述 Service Overview

数据关联整合服务是根据数据间的关联关系,将不同来源、不同格式、不同结构的数据从纵向(增加记录行)或横向(增加变量)进行关联整合,从而融合多来源数据,消除数据孤岛,提升数据内涵价值。


前置服务:数据资源盘点服务

服务内容 Service Content
  • 目标数据库设计部署
  • 异构数据统一存储
  • 同类数据纵向合并
  • 全局数据索引建立
  • 关联数据横向整合

目标数据库设计部署

分析待整合数据集的结构,提取关联关系,设计整合目标数据库。

服务产出成果物
  • 数据结构说明

    整合服务说明

  • 主数据库

    目标数据库

  • 数据整合程序

服务特点 Service Feature
智能匹配整合

智能匹配整合

对缺失主外键关联的实体数据,计算相似度和信任度,辅助智能匹配关联。

保持数据原始性

保持数据原始性

准确建立关联但不过度整理数据,保持数据的“原汁原味”,便于多种需求场景下生成数据子集利用。

整合结果可溯源

整合结果可溯源

关联整合的结果数据均可追溯到原始数据来源,并可查验处理过程进行优化。

整合过程可再现

整合过程可再现

服务过程全程记录,可重复执行再现结果,验证并提升服务质量。

关键点 Key Point
  • 代码版本不一致

    待整合数据的同一字段所采用的代码版本不一致。

  • 全局索引智能建立

    使用挖掘算法的主数据准确识别及全局索引的建立。

  • 数据动态更新

    增量数据需动态整合至目标数据库。