新华网北京5月22日电(记者李江涛)基于汉字字形形式化描述方法的汉字输入暨识别系统和留学生错字数据库已研发成功。这个系统成功解决了汉字教学存在的突出问题,对于留学生汉字教学、服务汉语国际教育具有重大意义。
汉字输入暨识别系统由北京语言大学宋柔教授与内蒙古师范大学林民教授合作开发。
宋柔22日在北京语言大学召开的汉字字形处理技术研讨会上说,这一成果旨在促进信息技术在汉字教学、典籍整理、汉字研究中的深层次应用。该系统也可用于典籍的文字保真输入、检索比对分析和出版,从而推进中华文化的保护和传承推广工作。
据了解,使用汉字输入暨识别系统已输入国际标准基本字符集中的全部20902个汉字,并输入了一批典型错字,建立了欧美留学生错字数据库。数据库中包含了从50万字、1000多篇留学生作文中抽取的全部错字。数据库还建立了高频错误偏旁库,对错字、错误偏旁和错误笔画组合进行了统计分析。
这个系统能使用输入笔或鼠标输入汉字,包括正字、错字和变体字,无须训练就能识别输入的汉字。这一系统能与各种通用编辑器、数据库工具结合,从而能在字形保真的前提下输入留学生的作文,能建立留学生错字数据库,并能利用通用工具的各种功能,像处理正字一样地处理错字、变体字。
(责任编辑:陈天晗)