湘桥农业网
日期归档
社会新闻 当前位置:首页 > 社会新闻 > 正文

汉王科技联合第一历史档案馆成功研发满文识别通软件

11月5日,在中国第一历史档案馆在北京举办的“改革开放40年满族档案工作回顾与展望”研讨会上,由第一历史档案馆与汉王科技等单位合作开发的基于这两个软件系统开发的满文图像识别软件系统“满文识别通行证”、“满文输入通行证”和“满文珠皮纪念全文检索数据库”正式发布。

汉王科技高级副总裁李志峰(右二)在项目成果发布仪式上代表合作企业发布了软件版本。

本项目软件开创了少数民族语言手写识别技术,填补了满族档案信息化和数字化领域技术和应用软件的空白,不仅带来了满族档案数字化和利用的跨越式变革,也为“互联网”时代如何弘扬中国历史文化提供了新思路。同时,该满族图像识别软件项目还获得了“2018年国家档案馆优秀科技成果特别奖”:

汉王科技,作为第一历史档案馆满族识别软件的技术提供商,在多年模式识别技术和应用经验的积累下,为古籍数字化保护提供了很好的解决方案。汉王科技的子公司汉王数码(Hanwang Digital)利用光学字符识别技术(光学字符识别,人工智能研究的重要领域之一)来识别和记录古籍,辅以图像整理和美化,可以快速高效地完成古籍保护。

汉王科技早在2015年就开始与一家历史博物馆合作研发“满族档案图像识别软件”。“满文文件图像识别软件”可以通过识别技术将满文文件的图像信息转换成可编辑和可检索的文本信息,同时可以实现识别模型的迭代更新。随着样本库的增加,识别率逐渐提高。该系统对满文行书的识别率为86.6%,对楷书的识别率为95.1%。其单机识别速度为每小时625帧,而人工处理速度仅为每小时4帧左右。另外,该软件操作简单,兼容性强,具有重要的推广和实用价值。可用于建立满文档案全文检索数据库,为民族语言遗产满文的传承和激活开辟了一条道路,并将推动满文档案工作和研究的跨越式发展。

软件界面可同时显示原始满文文件、满文标准字体或满文音译字母,便于校对。上图以满语朱批为例。左边是文件的文件名,浅黄色背景是文件图像,右边的拉丁字母是识别结果

满文文件类型多样,内容丰富。满族档案在全面准确解读历史中的独特作用和宝贵价值,是中华民族历史文化遗产的重要组成部分。据报道,在历史博物馆的1000多万份档案中,满族档案约占200万份,占馆藏的五分之一,是世界上现存满族档案数量最多的。过去,满族档案的整理、编目、编目和翻译基本上依靠专业人员的纯手工操作。这是一个耗时的项目。“满族档案图像识别软件系统”项目的研发,开拓了满族档案的工作思路,提高了满族档案信息化的效率,在一定程度上缓解了满族人才短缺的问题。此外,该项目也为其他少数民族文献数字化项目提供了参考。

这篇文章是网站管理员的家庭用户提交的。未经网站管理员同意,严禁复制。例如,如果大多数用户在稿件中发现虚假报告,欢迎读者反馈、纠正和报告问题(反馈入口)。

免责声明:这篇文章是对用户的贡献。站长的家只有浦



湘桥农业网 版权所有© www.clanigu.com 技术支持:湘桥农业网 | 网站地图