论文部分内容阅读
学籍管理,最主要的就是对学生的相关数据信息进行规整、处理。如何找到一条迅速准确链接学生信息表单的途径,成为管理好学生信息必须解决的问题。通过实践,笔者发现Office办公自动化软件中的Excel函数功能完全可以胜任这种机械的重复劳动。下面就利用Excel函数在学生信息处理中的具体应用进行论述。
1 实际问题的提出
某日,教务处接到省教育厅下发文件,要求核对05级新生名单信息。这需要在数小时内从3 831个数据中准确核出3 306个数据,而且要将前者的考试号一一添加到后者当中。
为便于描述,暂且将下载的数据表作为母表,将实际在册的05级学生信息表作为子表。
2 问题的解决
2.1 思路
如果进行手工处理,必然效率低下,且错误率较高;如果进行条件筛选,虽然在效率上有所改进,但工作量依然很大,很难在规定时间内完成任务。笔者利用Excel函数处理,利用身份证号的唯一性,将下载母表中的有效信息提取出来,重新按实际在校学生名单顺序进行链接处理,这样就得到了想要的结果。
2.2 具体方案
2.2.1 匹配定位
运用Match(lookup_value,lookup_array,match_type)进行匹配定位,其作用是通过匹配查找找到所需信息的单元格所在位置。主要参数:
lookup_value:要查找的值
lookup_array:要查找的区域
match_type:匹配形式(0精确查找,其他模糊查找)
以上搜索,如无匹配,则返回#N/A。
如S2=MATCH(子表!M2,’母表’!$F$2:$F$3832,0)(见图1)
2.2.3 索引
Index(array,row_num,col_num,),其作用为返回数组中指定单元格数组的数值。参数:
array:单元格区域或数组
row_num:某行号
col_num:列号
根据已知位置,反馈出想要的内容。
本例中单元格选择区域只是一列,故列号缺省(见图3),如P=INDEX($A$1:$A$3832,T2)。
2.3 注意事项
2.3.1 关键字段的选取
关键字必须是各表中的具有唯一特性的字段。通过关键字段的桥梁作用,将各张数据表联结起来。
考虑到身份证号在两张数据表中都具有唯一性的特性,这个问题中就只能选择该字段作为关键字。
2.3.2 引用
引用主要包含3类:绝对引用、相对引用,混合引用。绝对引用指在公式中引用的单元格地址是固定的。在公式复制到其他单元格时,引用的内容不会发生变化。换言之,就是将下载的数据段的在表格中的地址固化。相对引用指在公式中引用的单元格地址是相对地址。在公式复制到其他单元格时,它引用的内容会发生变化。如果没有将下载的母表中数据段的地址固化,会导致数据溢出,索引数据不完全,进而会影响查找的准确性。混合引用就是以上两者引用兼而有之。
在上述具体步骤中谈及的“MATCH(实际名单!M2,’A表’!$F$2:$F$3832,0)”实际就是一个绝对引用,其目的就是为了将母表中的数据段的地址固化,使得match函数在运行时有址可循,有的放矢。而索引函数“index()”却使用了相对引用,目的也是显而易见的,那就是在子表中的指针自动地由首行开始依次指向下个数据。在一般情况下,实际应用中主要使用的都是混合引用。
在实际操作中,一旦发生数据溢出问题,会出现错误提示符“#N/A”。反之,错误提示符“#N/A”也能在使用公式时给出相应提示。因此在出现“#N/A”时往往可能是由于引用方式应用不当造成的。笔者在处理本例时也曾有过类似的经历。2.3.3 举一反三
以上3条公式执行一次,仅仅只能判断出一条数据是否找到。要使子表中所有数据都必须在母表里检查一遍,需要挪动鼠标。将鼠标点选中第一个写入公式的单元格,移到右下角,当出现“+”时,双击鼠标左键,“一键”实现所有子表数据的查找匹配。
2.3.4 思考
尽管通过函数处理,将大部分数据都链接上了,但仍然有一些遗留问题。本例就留下有71条未能识别的数据。同时,在表格中显示“#N/A”。这说明在数据处理过程中还是有一些不匹配的因素存在。
经分析,数据中出错提示符号“#N/A”的主要原因是:(1)身份证号的15/18位匹配问题;(2)学生填写身份证号时,出现的前后不符情况;(3)由于外省生源没有统一时间上传更新补录新生名单;(4)预科、成教等学生没有在网上显示;(5)数据录入格式不一致。
对于以上5类原因的解决,可以采取这样的措施:(1)第1,2类是由于学生个人原因造成的,请学生再核实后即可解决;(2)第3,4类是客观原因,通过核对录取花名册,也可清理出来,再进行数据链接时可以先将预科、成教等学生信息处理掉,以减轻后期核对工作负担;(3)在进行数据录入的过程中难免会出现数据格式不一致的错误,为了尽量修正数据,尽最大可能对数据进行必要的规范,可以采用功能强大的Excel数据透视功能对录入数据进行实时监控,及时修正、规范数据;(4)优化参数配置,匹配定位时将“Match()”函数中“lookup_array”设为“$X:$X”,即选中某一整列,作为查询区间,这样可以省略具体方案中的调整这一步骤,达到殊途同归的效果;(5)数据前处理,即在进行数据链接之初,就对数据按关键字段进行必要的排序操作,以提高查找的效率。以学籍管理为例,进行数据前处理就很有必要。一般规模上万的数据处理也应该进行数据前处理。
3 结语
综上,在用Excel处理任何问题时也是开头难,解决好了第一个,以后的就很好办了。Excel批量化处理问题的优点在这里得到了全面的体现。但对于Excel函数的了解、应用还很不够,要想解决好实际问题,还需要进行不断地学习与探索。
1 实际问题的提出
某日,教务处接到省教育厅下发文件,要求核对05级新生名单信息。这需要在数小时内从3 831个数据中准确核出3 306个数据,而且要将前者的考试号一一添加到后者当中。
为便于描述,暂且将下载的数据表作为母表,将实际在册的05级学生信息表作为子表。
2 问题的解决
2.1 思路
如果进行手工处理,必然效率低下,且错误率较高;如果进行条件筛选,虽然在效率上有所改进,但工作量依然很大,很难在规定时间内完成任务。笔者利用Excel函数处理,利用身份证号的唯一性,将下载母表中的有效信息提取出来,重新按实际在校学生名单顺序进行链接处理,这样就得到了想要的结果。
2.2 具体方案
2.2.1 匹配定位
运用Match(lookup_value,lookup_array,match_type)进行匹配定位,其作用是通过匹配查找找到所需信息的单元格所在位置。主要参数:
lookup_value:要查找的值
lookup_array:要查找的区域
match_type:匹配形式(0精确查找,其他模糊查找)
以上搜索,如无匹配,则返回#N/A。
如S2=MATCH(子表!M2,’母表’!$F$2:$F$3832,0)(见图1)
2.2.3 索引
Index(array,row_num,col_num,),其作用为返回数组中指定单元格数组的数值。参数:
array:单元格区域或数组
row_num:某行号
col_num:列号
根据已知位置,反馈出想要的内容。
本例中单元格选择区域只是一列,故列号缺省(见图3),如P=INDEX($A$1:$A$3832,T2)。
2.3 注意事项
2.3.1 关键字段的选取
关键字必须是各表中的具有唯一特性的字段。通过关键字段的桥梁作用,将各张数据表联结起来。
考虑到身份证号在两张数据表中都具有唯一性的特性,这个问题中就只能选择该字段作为关键字。
2.3.2 引用
引用主要包含3类:绝对引用、相对引用,混合引用。绝对引用指在公式中引用的单元格地址是固定的。在公式复制到其他单元格时,引用的内容不会发生变化。换言之,就是将下载的数据段的在表格中的地址固化。相对引用指在公式中引用的单元格地址是相对地址。在公式复制到其他单元格时,它引用的内容会发生变化。如果没有将下载的母表中数据段的地址固化,会导致数据溢出,索引数据不完全,进而会影响查找的准确性。混合引用就是以上两者引用兼而有之。
在上述具体步骤中谈及的“MATCH(实际名单!M2,’A表’!$F$2:$F$3832,0)”实际就是一个绝对引用,其目的就是为了将母表中的数据段的地址固化,使得match函数在运行时有址可循,有的放矢。而索引函数“index()”却使用了相对引用,目的也是显而易见的,那就是在子表中的指针自动地由首行开始依次指向下个数据。在一般情况下,实际应用中主要使用的都是混合引用。
在实际操作中,一旦发生数据溢出问题,会出现错误提示符“#N/A”。反之,错误提示符“#N/A”也能在使用公式时给出相应提示。因此在出现“#N/A”时往往可能是由于引用方式应用不当造成的。笔者在处理本例时也曾有过类似的经历。2.3.3 举一反三
以上3条公式执行一次,仅仅只能判断出一条数据是否找到。要使子表中所有数据都必须在母表里检查一遍,需要挪动鼠标。将鼠标点选中第一个写入公式的单元格,移到右下角,当出现“+”时,双击鼠标左键,“一键”实现所有子表数据的查找匹配。
2.3.4 思考
尽管通过函数处理,将大部分数据都链接上了,但仍然有一些遗留问题。本例就留下有71条未能识别的数据。同时,在表格中显示“#N/A”。这说明在数据处理过程中还是有一些不匹配的因素存在。
经分析,数据中出错提示符号“#N/A”的主要原因是:(1)身份证号的15/18位匹配问题;(2)学生填写身份证号时,出现的前后不符情况;(3)由于外省生源没有统一时间上传更新补录新生名单;(4)预科、成教等学生没有在网上显示;(5)数据录入格式不一致。
对于以上5类原因的解决,可以采取这样的措施:(1)第1,2类是由于学生个人原因造成的,请学生再核实后即可解决;(2)第3,4类是客观原因,通过核对录取花名册,也可清理出来,再进行数据链接时可以先将预科、成教等学生信息处理掉,以减轻后期核对工作负担;(3)在进行数据录入的过程中难免会出现数据格式不一致的错误,为了尽量修正数据,尽最大可能对数据进行必要的规范,可以采用功能强大的Excel数据透视功能对录入数据进行实时监控,及时修正、规范数据;(4)优化参数配置,匹配定位时将“Match()”函数中“lookup_array”设为“$X:$X”,即选中某一整列,作为查询区间,这样可以省略具体方案中的调整这一步骤,达到殊途同归的效果;(5)数据前处理,即在进行数据链接之初,就对数据按关键字段进行必要的排序操作,以提高查找的效率。以学籍管理为例,进行数据前处理就很有必要。一般规模上万的数据处理也应该进行数据前处理。
3 结语
综上,在用Excel处理任何问题时也是开头难,解决好了第一个,以后的就很好办了。Excel批量化处理问题的优点在这里得到了全面的体现。但对于Excel函数的了解、应用还很不够,要想解决好实际问题,还需要进行不断地学习与探索。