摘 要
随着互联网的快速发展及进一步细化,数据录入行业逐步兴起。在此期间,各种类型的企业、个人和企业XX机构开始利用计算机技术实现对海量信息资源的收集、管理与共享,并且形成了以商业应用为主要目标的数字化经济时代。数据录入的发展必然是自动化、网络化的趋势,网络化离不开数据的标准化,而数据的标准化在自动化开始时就应当“一步到位”。数据录入与XX职能部门密切相关,由于各种因素的影响,我国目前对于数据的录入还没有统一规范和标准,这样造成了数据录入工作中出现诸多问题,给企业带来不必要的损失,同时也容易产生信息安全隐患。本文依据《全省生态环境宣传教育历史资料收集、整理、录入服务项目》来进一步探讨数据录入标准化问题,并提出对策建议。
关键词:数据录入;标准化;计算机技术
第1章 绪论
1.1 研究背景
近年来,我省生态环境保护宣传教育能力建设取得了积极进展,但与深入宣传xxxx生态文明思想的要求相比,仍存在较大差距。主要表现在全省环境宣传教育融媒信息化水平较低,特别是数据资料存储不系统、影像资料共享不充分、新闻宣传采编发不协同、环境教育基地和设施开放单位缺乏智慧化平台,不能适应新时期深入打好污染防治攻坚战的需要。
建设全省环境融媒平台是提升环境宣传教育能力信息化水平、推进环境治理体系现代化的重要举措。环境融媒平台设资源中心、新闻宣传、环境教育三大功能板块,其中资源中心板块可实现全省宣教数据(照片、视频)等资料云端存储、开放共享,提高资源使用效率;新闻宣传板块可有效实现智慧化推送新闻线索、素材,提高各地宣教工作人员新闻宣传的采、编、发协同能力;环境教育板块可有效整合环境教育基地、设施开放单位等公益资源,提高服务公众便捷化水平。
为深入宣传xxxx生态文明思想,提高生态环境宣传教育工作信息化水平,广东省省厅组织建设了广东省生态环境宣传教育融媒化服务平台系统(以下简称环境融媒平台),结合融媒平台的部署优化,实现对数据录入规范标准化机制,形成省市县互联互通的环保宣教大格局,为全面总结广东污染防治攻坚战成果,生动展示xxxx生态文明思想广东伟大实践提供有力的数据支撑。
1.2 本文主要研究内容
本文通过实践项目对数据录入的标准作为研究对象,根据实践对数据录入标准问题进行分析研究背景与意义、目的,以及我国数据录入标准的问题现状,
依托融媒平台进行数据录入作简单介绍,此平台对数据录入的标准以及规范性突出说明,从数据的收集、整理、录入三个阶段的标准化问题分析,指出数据录入标准在工作中的适用性。对数据录入的标准现状进行分析,分析数据录入标准在工作中存在的优点和缺点,归纳总结出存在的问题。结合此次实践项目中的数据录入标准分析,与我国现行数据录入标准相比,从而提出完善合理的建议和对策。
数据录入研究包括:数据采集与整理;分析处理 数据录入系统由硬件和软件两部分组成,其中硬件是用户使用最多、最简单的设备,它将各种数据从输入设备转换为计算机可接受和可识别的形式。软件是记录数据经过加工处理后的数据,实现信息的提取、存储和管理功能。数据库技术在我国发展迅速,但应用水平还很低,大量的数字资源还没有得到充分利用,如何合理地保护这些数据已成为社会关注的重要问题之一。
1.3 本文研究思路
明确选题的内容和意义,数据录入主要包括数据收集、数据整理以及数据录入,阐述数据录入标准化问题等主要概念以及理论基础。其次,以实践项目中使用数据录入标准为研究依据,对该数据录入标准的适用性进行分析,结合我国数据录入标准,并在上述分析的基础上,总结出数据录入存在的标准化问题,提出符合数据录入标准的合理性建议和对策。
1.4 本文内容结构
第一章,绪论。简要地介绍本文的研究背景、思路及方法。
第二章,数据录入理论以及质量控制概述。
第三章,数据录入的标准现状。通过国内外文献来研究。
第四章,对融媒平台及功能进行简单介绍,对数据录入的标准以及规范性突出说明,从数据的收集、整理、录入三个阶段的标准规范要求,体现出数据录入标准在工作中的适用性。
第五章,结合此次实践项目中的数据录入的问题分析,从而提出完善合理的建议和对策并进行数据录入后的检验建议。
最后为本文的总结。系统性的总结全文。
第2章 相关概念与理论
2.1 相关概念
2.1.1 数据录入
数据录入可分为问卷录入、数字录入、文件录入和Word文档录入、Excel数据表、WPS文档录入、纯英文录入、纯数字录入、中英文混合录入、网页HTML文件格式录入、PDF格式文档录入等。
数据录入,简单理解为将纸和图像数据转换成电子形式。 具体来说,从不同的维度输入的数据有不同的类别。 输入数据的形式分类:语音数据和文本数据; 数据分为一次性录入:批录入和零散录入; 按数据录入位置:远程数据录入和现场数据录入; 从数据输入的形式来看:按键式录入和机器连带应用软件识别自动录入; 自动化细分:自动化数据录入、半自动化数据录入和人工数据录入。 此外,就单独文本形式的数据录入而言,它也经历了一个演变过程,从表格形式输入开始,转向电子化表单,最后发展成为标准化表单的要素,此时输入数据的人只能看到要输入的标准化模块。最后从检验录入结果的角度,数据录入经历了检验和录入在同一台计算机上进行到数据双录和检验在不同计算机上进行的过程[17]。
2.1.2 标准化
在GB 3935.1-83《标准化基本术语 第一部分》中,对“标准化”作出了如下定义:“在经济、技术、科学及管理等社会实践中,对重复性事物和概念通过制订、发布和实施标准,达到统一,以达到最佳秩序和社会效益”。《中华人民共和国标准化法》的第一条就明确指出实施标准化法的目的:“为了发展社会主义商品经济,促进技术进步,改进产品质量,提高人民的利益,使标准化工作适应社会主义现代化建设和发展对外经济关系的需要[39]。”这说明标准化工作与社会发展和人民的生产、生活都有密切的联系,是一项十分重要的工作。而在GB 13143-91《情报文献工作词汇-传统文献》中“标准化”所得到的定义是:“可以供公众利用的技术规范或其他文献。它是为促使社会获得最佳效益,根据科学、技术和经验的坚实成果,经有关人士的合作协商或一致同意而起草的,并由国家、地区或国际一级的某一机构和团体所批准[40]。”
2.1.3 融媒平台
融媒平台是实现数据录入的载体,将所有的数据资源通过融媒平台录入进计算机系统,平台提供了资源中心、新闻宣传和环境教育三个功能板块,其中资源中心可实现所有数据录入以及云端存储、开放共享,提高数据的使用效率;新闻宣传可实现推送新闻素材等;环境教育可整合环境教育基地、设施开放等公益资源,提高便捷化水平。
2.1.4 PDCA循环
“Plan-Do-Check-Act”循环是由X质量管理专家休哈特提出的,后来由X质量控制专家戴明博士采纳推广。 因此,这个环被称为“戴明环”。 在全面质量管理以及通过在组织内各级应用项目设计和分析概念维持和持续改进这一过程的能力方面,这是一个应遵循的科学程序[38]。
PDCA循环可以让我们的思想方法和工作步骤条理化、系统化、图像化和科学化,因此它具有以下特点:
(1)不同水平的环环相套。PDCA循环作为质量管理的基本方法,不仅适用于整个工程项目,而且适用于整个企业及其科室、工序、班组以及个人。 根据公司的方针和目标,各级各部门都有自己的PDCA循环循环,分层循环,形成大循环,小循环。大环是小环的母体和基础,小环是大环的分解和保证。各级各部门小环围绕总目标,朝着同一方向发展。通过上下游循环或工程项目工作的有机衔接,相互促进发展。
(2)继续努力,不断进步。PDCA循环就像爬楼梯,在一个循环运转结束时,生产质量提高了一个步骤,紧接着规划下一个循环。
在PDCA循环中,A是循环的关键。处理阶段是PDCA循环的关键. 因为处理阶段是解决问题、总结经验、吸取教训的阶段。这一阶段将再次侧重于修订标准,包括技术标准和管理制度。没有标准化和制度化,PDCA循环就不可能向前旋转。
2.2 数据录入的主要内容
数据录入的概念与分类数据录入是指利用计算机或其他通讯手段将输入的各种信息按照一定格式记载下来的活动。它不仅可以节省大量时间和空间资源,还能有效地减少人力物力消耗;而且能够满足用户的需求和特殊情况下的服务。
数据录入原则。采集的数据必须符合客观事实和法律法规要求。数据录入应遵循客观公正、真实无误、完整可靠、保密安全的原则;采取的录入形式应当是自由选择的。数据库中存储的信息是随着网络的广泛使用而产生的新的知识信息。为了更好地适应网络环境下信息共享的需要,就必须根据网络传播的特点及信息的变化趋势,制定合理的数据录入策略。
数据录入的目标。数据收集的目标是从海量信息中找出确切的有用的信息,并且尽量减小搜索成本,缩短查询周期;数据录入方法:数据的采集主要包括两个过程:第一,将数据输入到计算机中,然后运行相关软件进行处理。第二,对所得的结果进行分析或者提供解决问题的建议。
数据的管理与维护。数据管理是指数据的采样、清洗和编辑等工作;数据的编辑则是将数据转换成文字和图表等格式。
数据的检验。检验的内容有两个方面:第一,是否满足要求;第二,是否达到预设的质量标准。如果不能满足要求,数据就会丢失。因此,数据的检测就显得尤其重要。数据的检查是指在检测之前,对数据进行审核、校正,以保证数据符合要求,防止错误的发生。
2.3 数据录入的质量控制实施标准
2.3.1建立数据录入的标准
目前,数据录入大多是手动操作,可以说数据录入是建库过程中最慢、最机械的工作,人为失误在所难免。此外,数据录入往往是一个分工和协作问题,因为数据录入的数量往往很大,而且必须及时客观地将最新数据存入指定专属库里,达到更新要求。由于不同工作者的习惯和方法不同,如果不建立一个标准化的录入工作流程,数据录入就很容易出现错误录入、遗漏录入、重复录入等问题。因此,对录入工作进行标准化控制和规范的管理是非常必要的,这对于保证数据库中数据的质量是非常重要的。在具体制定标准化工作流程时,应在宏观层面考虑以下原则:
(1)科学制定和规范数据录入工作流程的管理标准,严格按照提供的数据进行详细的数据录入。
(2)建立和完善录入程序和制度,明确未录入数据和已录入数据的区别,并备份妥善保管,以便今后查找和检查,纠正错误。
对某些特殊文字、图形符号、化学公式、原子结构公式等的记录,以及缺字、漏字等特殊情况的处理,应当制定相关标准规则,统一说明,保证每次数据录入的一致性和准确性。
2.3.2 ISO9000族标准
ISO9000族标准:ISO/TC176分别于1986和1987年制定了一套质量管理国际质量保证标准,并通过ISO正式发布。 后来,ISO发布了一系列国际标准,统称为ISO9000族标准。
ISO9000的管理思想是质量管理8项原则[37]:
(1)以客户为中心;
(2)领导作用;
(3)全面参与;
(4)过程方法;
(5)系统的管理方法;
(6)持续改进;
(7)基于事实的决策方法;
(8)与供应商的互利关系。
其中,“以客户为中心”是质量管理8项原则的核心,企业开展质量保证活动,不仅要为客户提供信任,更要满足客户需求,努力超越客户期望,不断提升客户满意度,才能赢得客户、创造利润。
基于过程的管理模式是ISO9000内容结构的基础,而构筑质量管理体系的建设是确定过程及其结构的基础,过程的建设直接关系到产品质量的过程,因此实施ISO9000族的意义:
① 加强品质管理,提高企业效益。 提高客户信心和市场份额;
② 推进企业质量管理规范化、程序化、法制化轨道建设。
③ 质量代表着企业的生产、管理和文化水平水平;
④ 降低质量成本,提高企业利润;
⑤ 满足客户要求,赢得客户信任,扩大市场份额;
⑥ 市场通行证;
⑦ 提高企业知名度和美誉度;
⑧ 全员素质的质的变化;
⑨ 有效规避产品责任。
第3章 数据录入标准研究现状
3.1 国外研究
数据录入的研究源于国外。从1974年到2009年,许多专家学者和学者从不同角度对数据录入进行了研究。首先,John Todd Rickman分析了数据录入和文字处理之间的区别,强调前者针对过期记录,其次是数据处理环节。Mark R.Dambro,M.D 和 Barry D.Weiss,M.D.在一所初级护理大学诊所采用电子化医学档案系统查明许多数据错误之后,开发了一个质量评估工具,以衡量错误率、查明错误渊源和改进数据[19]。 Katsuyuki Kinoshita、Teruki Teshima着重通过在数据库软件中嵌入逻辑检查函数、限制数据类型和输入范围以及减少错误来控制数据输入的质量[20]。Koji Takai专注于技术开发研究,开发了适合日本成年人心血管外科手术数据库的数据录入系统[23]。
3.2 国内研究
汤庸对于处于初始阶段的数据库应用系统,大量的初始数据会立即进入系统,他称之为“工程方法”[12]。冯妹引讨论了文献数据登录入库和质量控制问题,分析了文献数据录入的现状,研究了数据录入后的数据校验和计算机辅助纠错[14]。张润顺提出电子病历的结构化方法录入原则,遵循“证、证、治、效”四位一体的原则,最终确定了字号选择和字号字段赋值的原则和方法[16]。李昊旻以HL7CDAR2标准作为临床信息的结构化表达方式,针对标准术语概念分歧较大的问题,提出了SDE方法[28]。李伟证明,以电子数据获取为特征的临床研究数据管理系统,通过建立标准化的数据采集架构,可以有效地保证临床研究的质量,同时增强系统的数据录入功能[29] 。
可知,国外对数据录入的研究已经从注重数据录入的录入技术和方法转向注重数据的准确率和质量控制。国内的研究虽然起步较晚,但也呈现出这种趋势。文献[31-36]从不同角度阐述了数据录入已广泛应用于采矿、化工、医疗、政务、教育、金融等多个领域。它是收集和分析这些领域的数据并在此基础上作出正确决定的重要保证。
第4章 融媒平台数据录入的标准要求
4.1 融媒平台系统
4.1.1 服务对象
广东生态环境宣传教育融媒化信息服务平台的用户。
4.1.2 分辨率标准
屏幕分辨率宽度低于 1024 ,系统展示最理想的缩放比例为 67%;屏幕分辨率宽度低于 1280 ,系统展示最理想的缩放比例为 90%;对比,用户所使用的显示器最高分辨率宽度是 1024,为了能看全后台,可以打开 Chrome 浏览器,点击右上角调整缩放比例的按钮,设置为 67%。
4.1.3系统登录
如图4.1;正确输入用户名、密码进行登录。输入正确的用户名/密码点击登录后,继续输入正确的验证码后会自动登录。
图4.1 系统登录
4.1.4 数据录入
如图4.2;本地数据上传时,点击页面左边栏的“资源录入”链接,会 立即弹出文件选择框供选择资源文件。
图4.2 数据录入
4.1.5 数据标签标准
如图4.3;数据标签按照四个维度标准来定义,即业务领域、文档标签、人物、活动。已上传的数据可以重新进行标签设置:可从大图模式的图片 右上角菜单/小图模式文件详情右上角菜单/列表模式下的更多操作菜单进入某一数据的标签和编辑页进行资源的重新打标和说明。
图4.3 数据标签
4.2 数据的质量控制
为了规范数据录入操作,保证录入数据的质量,做出了《数据录入工作指引 》。指引规定了数据资料的收集内容、数据资料的整理规范、数据资料的录入标准三方面的内容,确保数据录入工作在统一规范的范围内正常有序的开展。同时,对数据处理提出了相关要求,明确了数据资料的管理制度。
4.3 数据收集的标准要求
根据要求重点收集整理环境保护机构成立以来特别是 2000 年至今的工作照片、视频(汇报类专题片、电视新闻、公益广告和抖音视频)等影像资料,包括:环境污染历史类;污染防治过程类;生态文明成果类;工作决策部署类;生态环境监测类;生态环境法治类;环评信访类;宣传教育交流类;环保科技支撑类;其他类。历史照片、视频等影像资料需按类别、自然年份归类整理。
4.4 数据整理的标准要求
数据资料收集后依据工作指引标准进行规范整理:
① 建立两个存储位置用于存放资料。一个在工作电脑,一个在移动硬盘,分别为工作和备份用;其中移动硬盘的资料不要做任何修改,作为原始数据备份。
② 将用户准备好的资料复制到自己的电脑,同时做好备份。
③ 用户移交过来的数据不能删除。
④ 做好数据分类:未检查数据:指从用户处拷贝过来的原始数据。检查无误数据:检查最下面的文件命名与文件对应的文件夹命名是否符合规范标准。
⑤ 数据的存储路径目录:需按照局-科室部门-年份-四要素数据文件夹名-四要素数据文件名的路径下存放,以满足平台的自动读取数据内容。
4.5 数据录入的标准要求
标准数据录入格式只是计算机网络通讯格式,必须有具体的数据录入细则作为补充,否则不能保证标准目的的一致性和检索的唯一性。由于系统的“一丝不苟”特点,即使有很小的差异,空格、标点符号、一字之差也会导致误检和漏检,严重影响系统查重准确性、用户数据检索效果。数据录入是否符合标准规范关系着系统平台对数据录入时的质量控制,因此在数据录入工作中要严格按照相关标准和规定执行。
4.5.1 数据的检验标准
① 每张照片、每段视频分别撰写说明,详细清楚列明时间、地点、人物、事件等要素。
② 同一事件/活动中的不同环节内容至少要选择3至5张主题鲜明、影像清晰的原始数据,数据标准大小大于 1MB小于5GB。
③ 视频资料要上传汇报成片的无压缩、无字幕版本或高清片段。
④ 数据不能旋转倒放,每个二级分类每年度数据不少于80条,总体数据容量标准范围为200GB。
4.5.2 数据的命名标准
(1)文件夹命名标准必须满足4要素:时间,地点,人物,事件(事件经过简述20字左右)。
(2)活动时间年月日的命名标准必须满足:活动文件及其所在文件夹中的日期格式标准:yyyy 年 m 月 d 日,即如:2020年6月8日。另外,不符合标准日期格式:yyyy.m.d,yyyy/m/d,yyyy-m-d。
(3)如图4.4;文件名主体名称与文件夹名必须保持一致。
图4.4 命名标准示例
4.5.3 数据录入标准
如图4.5;在平台开始数据录入时,主要内容里必须包括包括拍摄人/单位、活动时间、图片说明、 图片标签,数据录入后的拍摄人/单位、活动时间、图片说明这三项:必须要符合数据命名标准,在选择数据后,系统会根据标准要求进行自动填充处理;同时进行多个数据录入时,需按照标准处理好每一个数据,并及时点击保存编辑,只有保存后,才能进行数据录入。
图4.5 数据录入内容说明、定义标签
第5章 数据录入标准化存在的问题分析
5.1 项目中的数据录入问题
5.1.1 汉字字符集引起的不符合数据录入标准规范问题
汉字字符数量多,结构复杂,数据中会出现繁体字和异体字,因此汉字编码体制比西文复杂得多。常用信息数据交换的中文字符集GB2312-80收纳了6763个可用的中文字符,但是汉字字符数目超过60,000个。虽然6763个字符可涵盖99%的汉字字符,但依旧不能满足数据目录和数据检索的需要。GB2312-80缺少的词被称为“表外字”,表外字一般不直接进入系统进行处理。有些会使用同义词编目单位字同义字“空格”双字节双空格、汉语拼音、简化字或相似字来表示汉字软件来创建汉字。由于共用繁体字、异型字和简体字,所以这方面数据录入还未有标准。
5.1.2 由于数据源不规范因素引起的不符合数据录入标准规范问题
数据录入的标准包括文字录入标准和符号录入标准。也就是说,由于提供方和使用方没有按照此次制定的相关标准要求来执行,因此不符合平台对数据录入的标准,造成数据录入的失败,具体原因有以下几点:
① 用户提供的数据没有达到双方达成的相关标准规范。如:数据的大小不满足大于1MB小于5GB;数据过于混乱,没有按照规定的类别、自然年份归类整理进行提交;数据丢失。
② 数据录入过程中未达到标准。由于数据跨度大数据量多,并未未全部进行数据筛选,造成不符合数据标准的数据混入其中;对于命名不符合标准的数据未进行按照标准修改,造成数据录入时平台会出现错误提示。
③ 数据命名不符标准要求。整理的数据里,每条数据的命名不统一,并未按照正确的四要素来命名,日期格式也未按照yyyy 年 m 月 d 日的格式,比如:yyyy 年 m 月 、yyyy . m .d .、yyyy 、 m 、d 、等;数据命名中带有空格符号;这些数据的命名标准不规范,都会造成系统识别不出。
④ 数据标签定义没有达到标准要求。数据标签定义的四个维度的标准缺少任意一个维度,并不完整。
⑤ 平台系统因素。系统平台出现的一些技术问题也会间接的影响到数据录入的质量 ;比如无法正常读取符合标准的数据信息;平台账号偶尔会异常下线;数据录入一次性只能操作小部分数据等。
5.1.3 不同数据录入员的操作差异引起不符合数据录入标准规范问题
由于目前数录入还主要是手工通过计算机进行录入操作,因此数据录入工作是枯燥性机械性的工作,所以无法避免人为因素造成的错误;同时由于数据录入的工作量往往非常大,客观上要求最新的数据能够及时录入进系统以达到更新数据资源的目的,所以数据录入工作常常是多名数据录入员同时进行工作的,这样便存在着一个分工与协作的问题;此外由于每一个数据录入员的操作习惯和操作方法都各有差异,所以在数据录入工作中就十分容易产生错录、漏录以及重录等问题。
5.1.4 系统错误影响不符合数据录入标准规范问题
数据录入工作人员职责不同于系统设计专业人员,问题表现于当数据录入系统出现错误时,数据录入员擅自修改一些标准参数值,造成数据信息混乱,再者系统升级后系统设计人员未能及时告知数据录入人员,未能及时的进行升级模块的培训学习,直接或间接的影响数据录入的质量。
第6章 问题对策与数据检验
6.1 建议对策
6.1.1加强系统平台建设内容
建立系统平台的相关标准,加强平台信息反馈,及时解决数据录入过程中存在的问题,提高平台数据录入质量和效率。
6.1.2加强平台数据按照标准审批
严格按照数据收集、整理、录入等标准要求审核、筛选上传数据资料,确保符合相关的标准。
6.1.3数据源要按标准来规范
数据源信息和数据录入工作有一定的依存关系‚数据源标准化数据录入才容易标准化。
(1)建立数据源的一系列规范化的国家标准‚ 如数据命名标准、数据分类标准、数据汉字使用标准等。《标准》的编制要与数据录入现状及数据录入环境同步发展‚才是自动化、网络化建设的最佳保证。
(2)科学地制定数据录入的标准工作流程并实行规范化管理 ,严格按照统一的标引工作单上提供的数据逐项进行数据的录入。
(3)建立健全录入手续和制度,对于待录入的标引数据工作单和己录入的标引数据工作单,要作明显的区分标记,并对这些数据工作单分别进行妥善地保管,以方便后来的查找和纠错核对。
(4)对于一些特殊的文字、图形符号等的录入,以及缺字、少字等特殊情况的处理,要作统一的规定和说明,以保证各个录入员录入的一致性和正确性,同时也为检索提问词的输入提供正确的方法。
6.1.4工作职责区分
对系统设计员和数据录入员进行工作职责分离,不可混淆。否则预先设计的系统就有可能被修改或破坏,使得系统信息错乱,从而影响数据录入的质量。系统文件的修改或系统升级应该征得主管人员的同意,而且数据文件也应有专人保管、磁盘应妥善保管,并进行录入数据的备份。
6.2数据录入后的数据检验
6.2.1双向检验
两个数据录入员分别将待录数据进行两次录入并放入两个不同的临时文档,在完成一批数据录入后,对数据所在的两个不同的临时文档进行全等数据比较。由于同一点出错的可能性很低,如果在全等比较中发现两个相同应的数据之间存在差异,则可确定两个数据中有一个数据是错误的,并与原始待录数据进行核对来发现错误。双向校验查错率比较高,但是需要两个数据录入员分别进行重复录入,比较费时费力,所以在数据录入工作量比较小的情况下是比较适合使用的。
6.2.2格式标准检验
检验每一批书,检查它是否符合标准规范的标准录入格式。这项检验工作由计算机程序录入的数据格式对照标准录入格式进行比较,以查明是否有错位和漏录数据项等错误,但不会检查错误字符,因此只适合对数据录入进行整体一般性检查。
6.2.3逻辑序列检验
对于要录入的数据,进行一个上升排列的逻辑序号,该编号按序号作为数据录入临时文档,在录入一批数据后对照临时文档库中的逻辑序号进行检查,如果逻辑序号重复或丢失,则表示错误,需要进行删除或替换;不然可以将临时文档加载到主文档库中,删除逻辑序号。虽然这种校验方式在数据录入时增加了工作量,但它对于检查漏录和重录的数据非常有效。
6.2.4范围有效性检验
数据录入中数据项的值具有一定的范围或是指定的值。如果数据录入得到数据项的值超过此标准范围,即数据是错误无效。这个检验可以验证数据录入的有效性。这种校验方式可以检测到数据错录问题,但它是有条件限制的,它必须事先知道数据的标准取值范围,因此作用是有限的。
结 论
总的来说,数据录入工作虽然繁琐,但在实际工作过程中应当严格地按照相关的标准来执行,拒绝有标准却不执行的情况;在数据录入过程中更要擅于发现问题,由于一些数据录入问题的差异,标准可能需要进行升级完善,来获得最新的数据录入标准。
此次项目研究目的就是为了体现数据录入标准化是保证数据质量的前提,同时也为后续工作打下坚实的基础,随着信息技术的快速发展,标准化和规范化工作显得尤为重要。要把加强对国际标准的采用和对国际标准的宣传力度以及支持贯穿于日常数据标准化工作全过程中,建立健全数据录入标准体系,建立严格的把关制度,确保数据录入工作走上标准化、规范化的轨道。
参考文献
[1] 贺永良.几种数据据录入依据之比较[J].西北高校图书馆,1994(2): 38-39.
[2] 张晚霞.我国CIP数据分类标引标准化问题探析[J].科技情报开发与经济,2017,17(32):6-8.
[3] 张春阳,周继恩,刘贵全,等.基于数据仓库的决策支持系统的构建[J].计算机工程,2002(4):249-251.
[4] 陈京民.数据仓库与数据挖掘技术[M].北京:电子工业出版社,200.
[5] 冯项云等.国外常用元数据标准比较研究.大学图书馆学报,2001,(4):1-6.
[6] 辜寄营.基于元数据的综合数据管理与信息共享.成都:成都理工大学, 2003:1-52.
[7] 赵峰.试论书目数据的文字录入标准化.图书馆杂志,1997(2).
[8] 李竺,苏伟.论中文字符数据表达格式的标准化.图书情报工作,1997(8).
[9] 全国信息文献标准化第四届技术委员会工作报告.现代图书情报技术,1998(2).
[10] 全国信息文献标准化第五届技术委员会工作计划.现代图书情报技术,1998(2).
[11] 姜倩.基于价值流的数据录入生产过程分析与优化[J].商业文化,2009,12.
[12] 汤庸,毛承洁,魏际洲等.大批量数据录入技术及其处理工具研究[J].计算机应用,1997,3(2).10-13.
[13] 龚林妹.数据录入企业人员调度问题研究[D].西安电子科技大学硕士学位论文.2011.
[14] 冯妹引,周栓龙.文献数据的录入与质量控制[J].河南师范大学学报,1997,28(3).192-196.
[15] 李大可,王世伦.成绩录入系统确保数据正确性的策略[J].四川师范大学学报,2003,25(6).202-206.
[16] 张润顺等.名老中医电子病历中病史动态结构化数据录入规范[J].中国中医药信息.
[17] Brian Detlor. Internet-based information systems use in organizations: an informationstudies perspective. Information Systems Journal, April 2003, Volume 13,
Issue 2:113-132.
[18] Shari Shang, Peter B Seddon. Assesing and managing the benefits of enterprisesystems:the business manager’s perspective.Information Systems Journal.
October2002, Volume 12, Issue 4:271-229.
[19] Mark R. Dambro,M.D.,and Barry D. Weiss, M.D. Assessing the Quality of Data Entry in a Computerized Medical Records System. Journal of Medical Systems,1988,12(3).181-187.
[20] Katsuyuki Kinoshita, Teruki Teshima. Logical Checking Function Increases the Accuracy of Data Entry in the Patterns of Care Study. Strahlenther Onkol, 2003,179(1).7-12.
[21] Irina Kondratova, Scott Durling. Enabling Rapaid Development of Multimodal
Data Entry Applications. R Meersman, Z. Tari, P. Herrero et al. (Eds.): OTM 2007 Ws, Part I, LNCS 4805,2007,337-386.
[22] L. Beretta, V. Aldrovandi, E. Grandi. Improving the quality of data entry in a low-budget head injury database. Acta Neurochir(Wien).2007,149.903-909.
[23] Koji Takai. Development of a new data entry system suitable for the Japan Adult Cardiovascular Surgery Database. Gen Thorac Cardiovasc Surg. 2009.57.192-196.
[24] 黄鹏飞.森林资源管理信息系统快速录入数据的方法[J].湖南林业科技,1999,26(1).63-65.
[25] 杨波,叶俊勇,彭健等.高校网上录入数据录入管理系统的开发[J].重庆大学学 报,2000,18(06).185-189.
[26] 张夏林,汪新庆,刘刚等.复杂野外地质属性数据的快速采集方法探讨[J].地质科技 情报,2001,22(3).56-61.
[27] 陈书堂 , 王 勤 华 . 工 程 数 据 库 建 库 和 数 据 录 入 技 术 [J]. 测井技术,2004,20(5).153-158.
[28] 李昊旻, 段会龙, 吕旭东等. 结构化电子病历数据录入方法[J]. 浙江大学学报,2008,.8(10).326-330.
[29] 李伟,熊宁宁,卜擎燕等.电子数据获取系统在临床研究质量控制中的应用优势讨论[J].中国新药杂志,2009,5(12).452-456.
[30] 姜倩.数据录入业务生产控制与质量控制研究[D].西安电子科技大学,2010,51-65.
[31] 高歆.全球矿产资源数据录入系统[D].中国地质大学硕士学位论文.2006.
[32] 蔡晟. 铝电解槽通用数据录入系统分析与开发研究[D].北方工业大学硕士学位论文.2009.
[33] 孔玉. 临床试验数据管理软件系统开发与应用[D].第二军医大学硕士学位论文.2007.
[34] 刘春雷. 河南国税税收分析数据采集系统的分析与设计[D].山东大学硕士学位论文.2008.
[35] 高博. 大学教学评估数据中心的设计[D].内蒙古大学硕士学位论文.2008.
[36] 童畅.银行卡统计分析系统设计[D].山东大学硕士学位论文.2008杂志,2007,(3).
[37] 张公绪,孙静.新编质量管理学[M].北京:高等教育出版社,2003.
[38] 武占春, 王青, 李明树. 一种基于 PDCA 的软件过程控制与模型改进[J]. 软件学报, 2006, 17(8): 1669-1680.
[39] 科技信息标准指南.第一卷综述[M].北京:中国标准版社,1996:1.
[40] 科技信息标准指南.第二卷术语标准[M].北京:中国标准出版社,1996:27-28。
致谢
随着毕业论文的完成,意味作为学生的生涯即将告一段落。在学习的时间里完成了我人生的又一次蜕变,其间倾注了许多良师益友的关心和帮助,今借此机会向他们表示我最诚挚的谢意和由衷的祝福。
感谢广东理工学院,感谢经济管理学院,感谢学校和学院给我提供了一个良好的学习环境,并顺利完成我的学业以及本科毕业论文。
特别感谢我的指导老师的热情关环和悉心指导。从开始的论文选题、构思和资料收集方面都给予了我细致的教诲和无私的帮助,在此表示衷心得祝愿和深深的感谢!
感谢我的父亲母亲,是他们无微不至的关心、照顾及支持,使我得以有充足的时间和精力完成学业。
感谢我的朋友们,感谢他们提出的宝贵建议,衷心祝愿大家前程似锦!
最后,谨向在百忙之中抽出时间审阅论文和参加答辩的各位老师表示由衷的感谢!
1、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“文章版权申述”(推荐),也可以打举报电话:18735597641(电话支持时间:9:00-18:30)。
2、网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
3、本站所有内容均由合作方或网友投稿,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务。
原创文章,作者:打字小能手,如若转载,请注明出处:https://www.447766.cn/chachong/61743.html,