新华网乌鲁木齐1月1日电(记者王大霖)新疆日前推出维吾尔文、哈萨克文、柯尔克孜文印刷字符识别软件,这一少数民族印刷字符识别软件,实现了单文种与汉文、英文的双向混排文种的自动识别,填补了国内空白。
该软件由新疆大学信息科学与工程学院和清华大学电子工程系联合研制。
它的工作原理是:通过扫描仪或数码相机等光学输入设备获取纸张上的文字图片信息,利用各种模式识别算法分析文字形态特征,判断出文字的标准编码,并按通用格式存储在文本文件中。
据介绍,该软件能在视窗操作系统中正常运行,能够对图像倾斜进行自动校正,对图像进行自动版面分析等多项功能,识别率均高达96%。