科学抽取

如/你/所/愿

数据子集抽取服务

服务概述 Service Overview

对不能全量使用的数据,或数据全量分析利用耗费资源大、性价比不高,或特殊业务需要,根据科学可靠的抽取规则,从全量的数据中抽取部分数据形成子集进行利用,如样本抽样、配对抽样、队列模拟等。

服务内容 Service Content
  • 数据抽样
  • 数据配对
  • 数据子集抽取
  • 数据队列模拟

数据抽样

利用科学抽样方法(随机抽样、整群抽样、分层抽样、系统抽样、非随机抽样等方法)从指定的1个数据集中抽取一定数量的样本数据。

服务产出成果物
  • 数据结构说明

    数据量说明

    子集抽取服务说明

  • 目标数据库

  • 数据子集抽取程序

服务特点 Service Feature
关键点 Key Point

多源数据子集抽取

从多个异构数据源中抽取整合为数据子集。

1:N记录数据子集处理

按分层原则、就近原则、平均原则等提取同一对象的多条记录中的一条记录。