据《人民邮电》报消息 近日,由清华大学电子工程系智能图文实验室研究开发的“高性能东方文字文档智能全信息数字化系统”荣获国家科技进步二等奖。据有关专家介绍,该系统主要以清华TH-OCR(光学字符识别) 技术为核心,无论是技术水准、识别效果还是应用状况,都已经达到了世界领先水平。
随着我国信息化建设的全面开展,OCR技术诞生十余年来,经历从实验室技术到产品的转变,目前已经进入行业应用开发的成熟阶段。相比发达国家的广泛应用情况,OCR技术在国内各行各业的应用还有着广阔的空间。
据悉,“高性能东方文字文档智能全信息数字化系统”是基于清华TH-OCR技术的文字识别系统。通过该系统,用户可以将通过扫描仪、摄像机等光学输入方式得到的书籍、报刊、文稿、表格等印刷品的图像信息转化为可供计算机识别和处理的文本信息。与传统的案头文档管理相比,该系统最大的优势就是通过提供包括数据输入、数据管理和数据还原在内的信息平台,显著提高用户的工作效率。
专家指出,随着国家信息化建设进入内容建设阶段,OCR技术将迎来一个全新的以行业应用为主导的发展阶段。