作者:周钢 严奉云 张业 本文转载自《信息化研究》杂志2017年第9期,作者单位为全国组织机构代码管理中心。
京津冀地区同属京畿重地,濒临渤海,背靠太岳,携揽“三北”,战略地位十分重要,实现京津冀协同发展,是面向未来打造新的首都经济圈、为优化开发区域发展提供示范和样板的需要;是促进环渤海经济区发展、带动北方腹地发展的需要。
2015年4月中央政治局审议通过的《京津冀协同发展规划纲要》,纲要指出,推动京津冀协同发展作为一个重大国家战略,其核心是有序疏解北京非首都功能,要在京津冀交通一体化、生态环境保护、产业升级转移等重点领域率先取得突破。
各类组织机构是京津冀协同发展的重要主体,法人和其他组织统一社会信用代码信息涵盖我国境内依法注册、依法登记的机关、企事业单位、社会团体及其他各类组织机构的基本信息,因此,统一社会信用代码数据整合研究势必对京津冀协同发展战略具有重要的基础性作用。
一、统一代码基本情况
为解决我国组织机构代码不统一、部门间有关机构基本信息的数据割裂封闭问题,国务院同意发展改革委、工商总局、税务总局、质检总局等部门共同制定的《法人和其他组织统一社会信用代码制度建设总体方案》,建立覆盖全面、稳定且统一的以组织机构代码为基础的法人和其他组织统一社会信用代码制度。
按照《国务院关于批转发展改革委等部门法人和其他组织统一社会信用代码制度建设总体方案的通知》国发[2015]33号文件内容,法人和其他组织统一社会信用代码为18位,由登记管理部门代码、机构类别代码、登记管理机关行政区划码、主体标识码(组织机构代码)、校验码五部分组成。组织机构代码管理部门负责管理统一代码资源,建设和运行维护统一代码数据库,为各部门提供信息服务,加强统一代码赋码后的校核。因此,统一代码的基础信息可以保证完整性和统一性,可以涵盖京津冀地区组织机构基本信息的全集,对京津冀协同发展奠定坚实的信息基础。
二、京津冀区域统一代码数据特点分析
第一,具有全面性。截止到2015年底,京津冀区域统一代码存活的机构数量共计2,893,628家,其中北京市有1,279,318家,天津市有469,258家,河北省有1,145,052家,京津冀区域统一代码数据作为权威、全面的数据资源,是全国范围内唯一的、始终不变的法定代码标识。
第二,具有共享性。统一代码数据是重要的政务信息资源,对统一代码数据库进行开发利用是政务信息资源开发利用工作的重要组成部分,是各级政府、各部门开展电子政务、加强行政管理、监督企事业单位与社会团体的经济社会行为的有效技术手段。
第三,具有融合性。一直以来,京津冀机构代码数据由京津冀分别管理,三地代码数据信息处于相互孤立封闭的状态,三地代码数据信息未能实现共享。但三地统一代码数据的质量基础较好,且具备信息融合共享的条件,在明确整合边界、指标项和指标处理方法的情况下,三地统一代码数据整合将得以实现。
三、京津冀区域统一代码数据整合研究
对京津冀三地的代码数据进行规范性研究主要包括整合边界、指标项和指标数据处理三个方面内容。整合边界是指从京津冀统一代码数据库中,以时间和空间为维度提取对应范围内的机构数据信息,明确数据研究范围;指标项是指在整合边界确定的前提下,从数据角度出发选择数据的相关指标,汇集数据研究内容;指标数据处理,主要是对指标项进行数据清洗和标准统一的过程,是数据规范研究的重要内容,形成数据分析的统一口径。·
(一)整合边界
对京津冀区域统一社会信用代码数据提取分析的前提是数据的整合边界。本文以行政区划为基准,以统一社会信用代码的机构数据为研究对象,从时间和空间两个维度确定整合边界。
为深入研究京津冀三地的发展情况,在空间维度上提取区域和区县数据进行分析。区域数据,是从“面、线、点”的思路出发,根据四个未来不同的发展战略来提取。
第一,分区域发展战略范围。根据功能区将京津冀分为三个区域:北部生态涵养区、中部发展引领区、南部绿色崛起区。
第二,“一轴两横两纵”重点发展轴带战略。根据各地区的功能定位来确定各发展轴的范围。“一轴两横两纵”五个发展轴分为主轴和次轴两个等级,包括京津发展主轴,以及京唐秦发展次轴、石黄发展次轴、京石邯发展次轴、滨海发展次轴,其中滨海发展次轴是最重要的发展次轴。
第三,重点都市圈构建和“ 一轴两横三纵六圈多中心”的多中心网络型空间格局战略。
第四,区域中心城市打造战略。从区县尺度出发,提取数据。北京市共十六个区,即东城区、西城区、海淀区、朝阳区、丰台区等区。天津市共十六个区,即和平区、河东区、河西区、南开区等区。河北省共有十一个地级市,169个区县,其中石家庄市有二十二个区县,唐山市有十四个区县,秦皇岛市有七个区县,张家口市有十六个区县,承德市有是十一个区县,沧州市有十六个区县,廊坊市有十个区县,衡水市有十一个区县。数据提取空间的确定,可实现从多角度呈现京津冀三地经济社会活动在空间上的分布特征。
为深入研究京津冀三地的历年发展情况,以五年规划为基准确定数据的时间维度。从第十个五年计划、第十一个五年计划和第十二个五年计划中分别选择2000年、2005年和2011年作为时间区间,并结合京津冀协同发展战略内容,重点选取 2014年和2015年数据进行分析。数据提取时间区间的确定,为展现京津冀三地组织机构数据历年的变化和演变提供可能。
(二)整合指标项
中华人民共和国国民经济和社会发展第十二个五年(2011-2015)规划纲要,指出了国家战略发展方面,明确了政府工作重点,引导市场主体行为,是未来五年我国经济社会发展的宏伟蓝图,它分别从经济和社会两个角度对未来五年中国的经济和社会发展提出了具体规划。在经济发展角度,阐述农业、制造业、服务业、战略性新兴产业、高技术产业等产业未来五年发展规划;在社会发展角度,阐述社会保险、慈善事业、教育、医疗卫生、社会保障等产业未来五年发展规划。
本文以第十二个五年规划纲为依据,结合京津冀三地数据库现有数据资源, 选择经济和社会指标,并以《国民经济行业分类》(GB/T 4754-2011)为分类标准,对经济和社会指标进行行业划分(详见表2和表3)。在经济角度,选取制造业、服务业、战略性新兴产业和高技术产业四个行业作为经济指标。具体而言,选取汽车制造业,设备制造业,计算机、通信和其他电子设备制造业,医药制造业和生物医药行业共五个行业作为制造业的指标项;服务业选择了金融业,房地产,生产性服务业,软件、网络及计算机服务业,文化创意产业,科学研究与技术服务业共六个行业作为服务业的指标项。略性新兴产业选择能环保,新一代信息技术,生物,高端装备制造,新能源,新材料,新能源汽车作为战略性新兴产业的指标项;高技术产业选择信息技术、生物技术、新材料。
从社会角度选取教育、医疗卫生和社会保障三个行业作为社会指标。具体而言,选取学前教育、基础教育、普通高等教育、成人及职业教育和特殊教育五个部分作为教育事业的指标项;选择医院、基层卫生医疗机构和药店作为医疗卫生事业的指标项;选择社会保障及养护救助服务和养老院作为社会保障工作的指标项。
(三)不一致指标项的处理
根据京津冀统一代码数据的三个特点,三地指标项在标准等方面存在一定的差异。为解决此类差异信息的不一致性,围绕京津冀协同发展政策内容,需对不一致指标项进行处理,主要包括标准统一和数据填补两个方面。
1、标准统一
关于国民经济行业新旧版本统一口径问题。
结合三地特点和数据情况,2014年前的数据采用2002版《国民经济行业分类》标准,2014年后的数据采用2011版《国民经济行业分类》标准。
关于高新技术产业和文化创意产业数据口径不一致问题。
由于2011新版行业标准对高技术产业分类范围的扩大,导致2002版数据和2011版数据的差异性较大,高新技术产业可通过2011版计算出2014年的数据,并做标注说明;文化创意产业用2011版标准计算出2014年数据。
2、数据填补
关于机构成立日期和机构注销日期数据填补问题。
鉴于约20万机构的成立日期和首次办理日期均为空,且这些机构大部分为2000年前的数据,日期以发证日期作为补充。约有30万机构的注销日期为空,且主要集中在北京,以北京市组织机构代码数据作为补充。
关于迁入迁出数据的填补问题。
迁入迁出机构信息是京津冀协同一体化基础信息中的重要组成部分,统一代码数据没有迁入迁出的直观数据项,但可以通过行政区划以及三地整体的新增、注销、法人等信息统计五年内的迁入迁出数据。
四、结语
本文通过分析京津冀统一代码的数据特点,从空间和时间的维度明确了京津冀统一代码的数据边界,梳理了指标项内容,总结了重点指标项的处理方法,形成了系统的京津冀地区的代码数据整合研究,对京津冀各类机构的整合奠定了基础,对京津冀协同发展提供了基础数据支撑。(作者:周钢 严奉云 张业 作者单位:全国组织机构代码管理中心)