当前位置:首页 > 专题专栏 > 农业普查 > 经验交流
如何提升大型普查基层数据处理能力
发布日期:2018-01-05浏览:保护视力色:【字体:

□ 汉赤明/文

  数据处理是大型普查的重要环节。自2014年第三次全国经济普查使用手持电子终端设备(PDA)进行现场登记后,PDA相继在2015年1%人口抽样调查、2017年第三次全国农业普查中广泛使用。PDA的使用给传统的数据处理工作带来了全新模式,给省以下基层数据处理工作带来了新的挑战。通过对第三次全国农业普查全过程的组织领导,深感基层数据处理工作需要作深层次的革新和转变。本文以第三次全国农业普查为例,浅析省以下各级数据处理工作在组织管理、开发应用方面存在的问题,并提出对策建议。

  存在的问题

  普查方案与数据采集程序衔接不够。一是普查方案定稿滞后,给PDA采集程序的开发留时短。在实际工作中,普查方案必须最先确定,只有普查方案定稿发布,PDA数据采集程序、数据处理程序才能够进行开发。《第三次全国农业普查方案》于2016年7月5日才发布,留给PDA数据采集程序开发的时间很短。程序开发滞后,又影响了各级的培训,特别是普查员的培训。二是PDA中的登记项目和方案不一致,PDA中增加了部分指标。国家最先开发了一个PDA采集程序供培训使用,这对于培训地州市以上的数据处理人员是适用的,因为这部分人员素质高,其需要掌握的是程序安装、调试技术,他们对PDA登记的具体内容不关心。但对于具体入户登记的普查员来说更关心实际登记的内容。由于PDA数据采集程序增加了指标,跟培训时不一致,造成登记错位的现象发生。三是不同的普查表相同的指标数据单位不一致,造成普查员登记错误。比如《农户普查表》《规模农业经营户普查表》《农业经营单位普查表》都有一个共同的指标是“服务收入”,其在农户表中单位是“元”,在规模户表和单位表中是“万元”。普查员转填规模户表和单位表时思维仍是元,从而造成规模户表和单位表数据错误。

  PDA采集程序、数据处理系统逻辑审核设计欠严谨。一是PDA机载逻辑审核没有自定义审核功能,发现需要控制的逻辑审核,无法追加逻辑审核公式。方案中设计的很多作物只有北方才种植,培训时虽经反复强调,但普查员还是很容易登记错误,如“谷子”“棉花”等。也有些作物只在个别区域存在,如早稻、双季晚稻,普查员见到“稻”就填,造成数据错位。凡此种种,如果有自定义逻辑审核条件功能,就可以根据本地实际设定必要性审核和确认性审核,杜绝此类错误的发生,从而提高登记数据质量。二是数据处理逻辑审核公式设计不方便使用。数据处理程序虽然设计了自定义审核功能,但专业性太强,自动选择函数库不齐。定义一个审核公式,专业人员也要先阅读上级类似公式才能找到所需函数和表达方式,对于市、县级数据处理人员来说很不适用。三是大量需要上级考虑设计的审核公式缺失,造成很多逻辑错误漏审。例如家庭成员年龄与文化程度的关系、单独某种作物种植面积与规模户的关系、牲畜存栏数量与家庭收入的关系等均应设置必要的审核公式加以提醒。由于PDA登记时缺乏这些审核,出现了大量奇异值。

  数据处理与普查业务脱节。采用PDA进行入户登记后,市、县一级的数据处理工作与普查业务融为一体,合二为一。在实际工作中,由于普查员文化水平低,对PDA操作不熟悉,需要数据处理人员全程指导。数据处理阶段出现大量的逻辑错误,需要数据处理人员与业务人员深度沟通,形成符合本地实际的审核公式,才能将登记时产生的奇异值查明修正。

  产生的原因

  分析本次农业普查数据处理存在的问题,主要原因有以下几点:

  数据处理模式的更新未准确定位基层数据处理的职能职责。采用PDA入户登记后,省以下基层数据处理模式和任务发生了较大变化。本次普查,省以下数据处理无需部署数据采集中心、数据交换中心、数据管理中心、移动终端管理平台(即三中心一平台)。PDA和网络的结合,使数据录入工作前移至普查员入户登记,数据逻辑审核查改下沉至乡镇。因此,数据处理方案必须适应新的模式,明确各级数据处理的职责。

  数据采集程序开放性差。一是PDA采集程序缺少指标隐藏功能。为了方便基层普查员的登记,采集程序的设计需要能够隐藏本地不存在的作物和畜禽。比如北方作物谷子、棉花等,在南方不种,南方普查员就可以把该指标隐藏掉,这样既减少显示内容,也避免普查员错项填报。二是缺少逻辑审核公式追加功能。比如,有的建档立卡贫困户都是国定标准、内陆地区没有海水养殖等,均可以设定审核公式来提醒普查员登记错误。

  数据处理程序扩展性差。一是自定义审核、自定义汇总表功能说明简单。自定义审核没有说明,自定义汇总表专业性太强,自动化程度低,这给基层审核数据、开发数据带来极大不便。二是自定义审核、汇总所需要的函数既没有在系统上提供完整,也没有在系统说明中介绍。比如定义审核公式,只有认真读、反复读国家系统中的上级审核公式,找到类似审核来猜需要哪个函数,有时还不知道如何使用参数,使用极为不便。三是查询公式无法共享。进行了查询公式共享给同级和下级用户的操作,但下级用户和同级用户仍无法共享,让基层用户做了很多重复工作。

  改进的建议

  加强普查员选调与培训,从源头提高数据质量。一是严格普查员选聘。高素质人员是确保普查数据质量的关键。在实际工作中,每个普查区选聘1-2名具有组织领导能力,熟悉普查区情况,有一定普查经验的普查指导员。每个普查小区选聘1名年轻、有初中或高中以上文化程度的普查员。具体入户登记时,聘请村民小组长作为向导并介绍本户相关情况,从而保证登记质量。二是狠抓普查业务培训。普查方案的培训,必须认真对照方案设计的每一个指标逐一进行解释,培训结束除进行书面考试外,还要组织学员具体到农户家进行试登记。PDA操作技术培训要注重入户试登记这个环节,必须把方案与PDA有机衔接到一起。

  增强程序开放性和扩展性,切实减轻基层普查员负担。一是PDA采集程序应具有指标隐藏功能,对区域内不存在的指标隐藏起来不显示,这既减轻普查员负担,又提高了数据质量。二是PDA采集程序和数据处理程序必须设计自定义审核公式功能。要编辑完善的操作手册和说明,以方便基层数据处理人员操作。

  强化业务与数据处理工作的协调配合,切实增强基层数据处理的前瞻性和系统性。PDA和网络平台在普查中的应用,使数据处理模式发生了根本性的变化。数据处理已经不是一个独立的环节,而是与整个普查合二为一,融为一体。PDA的应用使数据录入从入户登记就开始,时序提前,规模扩大,范围更广,管理和指导更困难。要使数据处理与普查业务深度融合,首先数据处理人员一开始就要参与业务培训,研究业务,学习方案。业务人员也要学习PDA操作,学习审核、评估、验收、上报等数据处理知识。其次数据处理人员要从如何用计算机技术来解决普查现实问题的思维,研究通过设定审核条件等控制PDA登记错误,提高录入数据的质量。通过查询、审核、汇总等技术,净化提交到数据处理系统的数据,切实将那些奇异值检索出来加以更正。

  (作者单位:云南省保山市统计局)


作者:汉赤明 来源:中国信息报