国家法人单位基础信息库

案例概述

助力国家工商总局实现全国法人单位基础信息的采集以及主题库的建设。采集全国法人数据总量10亿+,同步全国法人数据表总量3400张+,每日处理增量数据2000余万。

需求
以工商部门工商登记改革为契机,通过推进工商业务协同一体化进程,建立国家法人单位基础信息库,收集全国各类市场主体基础信息和行为信息,为企业法人基础信息资源库提供数据支持。以企业法人基础信息为基准,建立信息共享和校核机制,逐步建设内资企业、外资企业、个体工商户、农民专业经济合作社、农资市场、网络经营主体、直销企业管理、广告经营主体等方面的业务信息库。
国家法人单位基础信息库汇集了协同业务平台所产生和收集的各类信息,通过数据汇聚、数据管理、数据分析、数据统计、数据共享和联网应用业务,对全国市场主体的信息进行整理,为工商部门全系统协同监管提供数据支撑,为各部门提供信息共享服务,为政府决策、社会投资和行业监管提供数据决策服务。

解决方案
采用东软SaCa Data Integration数据集成解决方案技术,建立高效快捷、安全可靠、高数据质量的全国法人单位基础信息库,其中包括法人单位基础信息库、总局各主题库、公示同步库等建设,技术实施环节主要涉及下级各单位的数据质量校核、比对、数据交换、数据转换清洗和数据服务等。

客户介绍

国家工商总局,是依照法律、法规进行市场监督管理和有关行政执法工作的国务院直属机构,主要职责包括:
1,负责市场监督管理和行政执法的有关工作,起草有关法律、法规草案,制定工商行政管理规章和政策。
2,负责各类企业、农民专业合作社和从事经营活动的单位、个人以及外国(地区)企业常驻代表机构等市场主体的登记注册并监督管理,承担依法查处取缔无照经营的责任。
3,承担依法规范和维护各类市场经营秩序的责任,负责监督管理市场交易行为和网络商品交易及有关服务的行为。
4,承担监督管理流通领域商品质量的责任,组织开展有关服务领域消费维权工作,按分工查处假冒伪劣等违法行为,指导消费者咨询、申诉、举报受理、处理和网络体系建设等工作,保护经营者、消费者合法权益。

面临挑战

国家法人单位基础信息库是将全国各省市的法人单位基础信息,经过数据采集、转换、质量管理、比对等多种数据处理环节,最终汇集到工商总局数据中心,是对全国市场主体的信息进行整理,为工商部门全系统协同监管提供数据支撑,为各部门提供信息共享服务,为政府决策、社会投资和行业监管提供数据决策服务。
法人库历史的数据处理架构采用的是IBM Datastage解决方案。随时时代的发展和企业不断的增多,原有数据处理架构早已不能支撑业务发展的需求,主要问题如下:
1,集中在数据采集不及时,15个省份的数据要在第二天才能上报到总局进行ETL处理,严重影响业务办理;
2,由于所有省市的数据ETL处理环节都在总局处理,导致总局的ETL处理时间超长,影响业务处理时效。
3,总局对外共享的数据直接通过共享数据库实现,存在数据库访问安全和数据安全隐患。
4,各省市上报的数据质量参差不齐,数据标准化程度不够且质量不高。
东软集团在承接该项目建设后,充分分析了原有数据处理架构的主要问题原因,并结合自身优势和行业业务积累,制定了如下建设思路,既可以解决原有历史架构的问题,又能满足客户对数据处理的时效性、一致性、完整性等要求:
1,以数据应用为导向,汇总效能与数据质量统筹,构建高效、持续、多样的数据服务;
2,以提升效能为首要,基础升级与链路改造兼顾,重塑并行处理、运转高效的数据汇总通道;
3,以源头治理为重点,事前防范、事中监控与事后评估并重,构建全方位、体系化的数据质量控制模式;
4,以平台建设为抓手,“管数据”与“管人员”并举,形成数据可监控、绩效可评估的数据管理;
5,以“国产化替代”为切入,多种技术与多样产品并包,构建自主可控、安全可靠的数据安全。

解决方案

综合运用数据集成产品构建数据集成平台,实现可统一配置管理、数据可监控、结果可评估的数据集成管理平台;
构建数据质量平台,以源头治理为重点,构建事前防范、事中监控与事后评估的数据质量控制模式;
采用实时数据采集平台,以提升效能为首要,加速数据采集、传输效率。
数据中心升级改造的内容和策略:

系统逻辑架构:

DI产品应用场景:

省局业务数据上报的流程:
1,利用SaCa DataTransform产品将省局上报库中的数据进行转换清洗并写入到前置汇总库。
2,写入前置汇总库后,利用SaCa DataQuality和SaCa DataCompare产品进行数据质量校核,校核成功后写入到镜像数据库中。并通过SaCa DataExchange产品将前置汇总库的数据传输到总局的“总局汇总库”。
3,总局汇总库收到数据时,会利用SaCa DataQuality产品进行二次数据校核,并将问题数据写入到问题数据校核库。同时利用SaCa DataTransform产品将数据转换清洗后写入到“公示同步库”中。
4,在写入公示同步库的同时,总局还会利用SaCa DataTransform产品将各省份上报的数据进行转换清洗并形成各个主题库,或写入到其他部门的共享库中。
5,总局在形成主题库后,会利用SaCa DataServices产品将各个主题库的数据,封装成API接口共享给下属各个省份工商局。

实施效果

采集全国法人数据总量10亿+,同步全国法人数据表总量3400张+,每日处理增量数据2000余万。
河北、江苏、浙江、江西、湖南、海南、四川、云南等8个省份可以实现实时的数据汇总、上报。其余省份可在4小时内完成数据汇总、上报。
通过数据质量和比对平台,大大提升了各省市的上报数据质量,使得汇总后的数据可信、可靠、可用。
凭借数据服务平台,将总局汇总生成的主题数据库内容通过接口形式共享给下级部门和外部单位,即可以依据不同业务需求快速构建共享数据服务接口,也可以保证数据库的访问安全和数据安全,同时也可根据不同的用户角色,设定不同的数据访问权限,提升了数据共享的灵活性。

相关产品

2019-05-06T17:31:25+00:00