“古彝文”是指在民间流通使用的原生态彝文,传承至今已有数千年历史,是世界上最古老的文字之一。为契合数字时代的新要求、积极推动古文字数字化进程,日前,合合信息联合上海大学、华南理工大学团队针对现有的《西南彝志》、云贵一带古彝文字符开展统一编码,并于近期发布了业内首个古彝文基础编码数据库(简称“数据库”)。
古彝文典籍编码、识别过程
古代典籍的数字化的进程相对缓慢,不仅是由于受市场需求的制约,同时也存在着技术障碍。根据《滇川黔桂彝文字集》,古彝文多达87046字,且传统的古彝文来源于岩书、布书、竹简等难以长久完整保存的载体,被拍摄成图片后斑驳的画面极大地影响了后续的内容识别。为此,研究团队采用了合合信息旗下扫描全能王的“智能高清滤镜”,以公司强大的智能文档图像处理技术,高效解决古彝文图像电子化的问题。
据了解,合合信息已在智能文字识别、智能图像处理领域深耕十余年,“智能高清滤镜”功能也是其技术优势的典型表现。基于AI技术及智能扫描引擎,该功能可以自动检测图像中存在的问题并判定图像的优化方式,实现模糊、阴影、屏幕纹等干扰因素一键全处理。比如,对于污渍、残破的彝文古籍,只需在拍摄扫描之后通过“智能高清滤镜”快速处理,就可还原图像高清质感,以提高古文字编译的效率和准确性。
“智能高清滤镜”可通过深度学习技术,让AI代替人去“思考”,达成图像识别、检测、分析、处理的全链路闭环,最终为用户自动选择出好的处理方案,让图像处理更智能、文字识别更精准、版面还原“所拍即所得”,一键满足用户办公、学习、个人生活、政务、商务等场景下的高清无损扫描需求,给用户带来准确、高清、便捷的使用体验。
文字间的识别有相通之处,AI技术的精进,或将为人类破译古文字密码带来更多的可能。在此前的2021年、2022年世界人工智能大会上,合合信息早已展现了其智能文字识别技术在甲骨文识别、西周钟鼎文(金文)识别中的应用,也为古彝文识别奠定了良好的技术基础。未来,合合信息也将继续专研深耕,为推动文化数字化战略的有效实施和文化产业的高质量发展贡献科技力量。