修复敦煌遗书的模型背后,不只是硬科技,更有人情味
7月4日至7日,2024世界人工智能大会(WAIC)在上海举行,本次WAIC以“以工商促共享,以善治促善智”为主题,重点围绕核心技术、智能终端、应用赋能三大板块,聚焦大模型、算力、机器人、自动驾驶等领域。
在展会现场,一卷AI修复后的高清版“敦煌遗书”引发围观,公众可在不同位置扫描样本卷轴,见证AI如何通过字形修补、褪色修复、背景补全。
“敦煌遗书”是敦煌莫高窟藏经洞出土的公元4至11世纪的古写本及印本的统称,所涉内容广泛,被誉为“中国中古时代的百科全书”。然而在晚清时期,它们被迫流散于世界各地,且大量文献存在不同程度的残损,敦煌遗书的保护、传承工作,时刻牵动着社会公众的心。
在合合信息展台,我们看到了敦煌遗书系列文献中《汉书·刑法志》节选章节的AI修复版本。那些脏污、残缺、磨损的字迹在“AI古籍修复模型”的加持下,一一变得清晰可辨。这份曾凋零在千年时光中的残卷,被AI拂去岁月的痕迹,第一次以完整的姿态展示给关注者们。
高清版“敦煌遗书”。南都记者马宁宁摄
敦煌遗书《汉书•刑法志》修复效果展示(局部)。
AI技术助力古籍修复,推动文化与科技融合创新
数字化修复是延续古籍生命力的重要手段。据介绍,“AI古籍修复模型”由合合信息旗下扫描全能王团队携手华南理工大学团队共同打造,双方将AIGC技术应用于敦煌遗书残卷的数字化修复,成功解决了中文古籍文档中存在的文字残缺、字迹污损难辨认等问题。
其中,扫描全能王团队提供了智能高清滤镜算法支持,使得AI古籍修复模型具备优秀的图像处理能力,可解决古籍文献中存在的模糊、阴暗等图像质量问题。基于待修复区域的内容和位置先验信息,模型可智能学习不同古籍文字风格、纸张背景,对损坏区域的字体内容、风格进行高度还原,尽量确保修复区域的文字风格和背景与原古籍的一致性,用科技让文化遗产焕新。
本次世界人工智能大会期间,合合信息展位开放了敦煌遗书合成样本的文字修复体验项目,观众可以在不同位置扫描样本卷轴,见证AI如何通过字形修补、褪色修复、背景补全等方式,完成古籍的数字化修复。
世界人工智能大会敦煌遗书文字修复效果演示。
据现场工作人员介绍,古籍修复团队目前主要在图像修复领域进行了新的探索,重点关注修复过程中的古籍页面环境分析及处理,文字字体自动学习及补全,色彩还原等领域。团队成员表示,古籍的数字化修复是一项艰巨、浩大的工程,未来也希望能联通更多专业的文献研究机构及技术专家,共同提升数字化修复精度与效率,促进古籍文物的时代价值挖掘与知识发现,推动中国传统文化与现代科技的融合创新。
AI应用背后:不只是硬科技,更有人情味
除了古籍修复之外,以扫描全能王“智能高清滤镜”为代表的AI技术正被越来越广泛地应用在日常生活中:有人用它保存半个世纪前的家书,有人用它观察微雕艺术,有人用它还原家里的“老古董”字画、旧报纸……世界人工智能大会现场,合合信息展示出了五花八门的AI应用背后不只是“硬核”技术,也有丰富温暖的“人情味”。
“我最亲爱的儿子,好好保养身体,苦心求学……父在今年精神很健康,惟愿我儿在外专事业务,力求实际……”世界人工智能大会期间,一份尘封半个世纪的家书引起了参观者们的驻足。1956年,一位父亲从陕西大荔给在西北工业大学求学的儿子寄出了这封信。薄薄的宣纸,满载着长辈对孩子的爱意,以及对于青年一代学成报效祖国的期许。这份情感被扫描全能王“高清”收录,文件不用再继续遭受岁月的侵蚀,也能让更多人看见;科技的发展,让家国情怀实现了永恒的延续。
扫描全能王“智能高清滤镜”扫描20世纪50年代的家书。
在扫描全能王“智能高清滤镜”展区,参观者在使用滤镜提升图像清晰度后,可从4厘米长的核桃上提取一组微雕文字,每个字仅有1毫米长。“山高月小,水落石出;清风徐来、水波不兴。”这就是我们耳熟能详的“核舟记”,新时代下“核舟记”蕴含的精巧、细致之美,正在被AI以另一种方式续写。
扫描全能王识别核桃上的微雕文字。
此外,为了让参观者更好地体验移动端扫描的便利,修复敦煌遗书的模型背后,不只是硬科技,更有人情味展区还摆放了国画、斑驳的旧报纸等材料,经过扫描全能王“智能高清滤镜”处理后,阴影、折痕等干扰物被一“扫”而空,画面颜色被算法智能还原,留下的是色彩鲜明、版面平整、清晰美观的“收藏级”电子文档。
AIGC技术支撑,扫描全能王实现“所得超所见”
优质的画面处理效果、精准的文字提取功能背后,AIGC技术是卓越的“功臣”。本次大会上,扫描全能王集中展示智能高清滤镜、照片高清修复、扫描件文字编辑、智能擦除等典型的AIGC相关功能。
据介绍,通过融合生成式AI技术,扫描全能王具备了优秀的图像增强能力,快速学习多种文档的图像特征,可智能修复图像、去除噪声、优化颜色等,使图像更加清晰美观。典型应用如被誉为扫描“黑科技”的智能高清滤镜。
近日,合合信息旗下扫描全能王升级发布了智能高清滤镜2.0版本功能。新版本的智能高清滤镜利用生成式AI技术进行视觉增强,保持并提高图像的清晰度,让AI辅助人类思考,一键解决模糊、阴影、透字、褶皱、污渍、颜色不均、角度倾斜、形变、摩尔纹等数十种问题。
在现场,参观者可以尝试在背光的情况下,扫描透字的作业本。可以看见,扫描页面的清晰度显著增强,老师线上批改作业不用再担心画面过暗、模糊、阴影、透字等问题。
扫描全能王“智能高清滤镜”处理文档透字、手指、阴影,并进行清晰度增强(右图)。
在实际应用场景中,人们除了会遇到环境、拍摄角度等外力原因带来的扫描障碍,文档本身存在的透字、页面模糊、清晰度不足等“不可抗力”也会影响扫描的效果。比如尘封已久的资料,褶皱的文档会让文字变得模糊不清;热敏纸上逐渐褪色的文字,即使用户反复调整拍摄角度和滤镜,也无法获得清晰的扫描效果。
智能高清滤镜2.0一键处理阴影、褶皱、水渍、脏污等多种问题。
智能高清滤镜2.0助力多方向文字提取。
据扫描全能王事业部产品总监许昌华介绍,为了提升场景兼容性,扫描产品除了要做到“所见即所得”的还原度,对于图像质量低下的文件,还要通过科技手段,实现“所得超所见”。在生成式AI技术的支持下,扫描全能王智能高清滤镜2.0版本具备优秀的图像增强能力,显著提升图像清晰度,用户只需点击拍摄按钮,便可自动生成一张如原稿般清晰平整的图片。
在AIGC技术的加持下,扫描全能王还可以文档内容进行深度理解,提高产品对不同类型图像的识别能力,在实际场景中根据文档特性,进行场景化的判断与处理,为用户提升信息的存储与检索效率奠定了基础,如“扫描件文字编辑”功能,从“增、改、删”三个方面解决用户在合同、报告、作业等文档图片中存在的修改痛点,让用户无须受制于细微的调整而耽误项目的进度。
扫描全能王的另一项重点功能是“照片高清修复”。该功能可修复老照片上的破损之处、折痕、人脸细节,并通过AIGC算法对照片区域的上色需求进行研判,对照片中的室内外环境细节及颜色进行还原,使得修复效果更自然。
此外,产品还上线了“智能擦除”功能,让用户只需简单涂抹即可擦除图中杂物,根据背景特性,无痕填充被擦除的区域,使得擦除杂物后的照片看起来更自然。
14年打磨,练就文档处理“超能力”
从拍照扫描、提取文字,到智能高清滤镜实现“所得超所见”的背后,是扫描全能王团队在文档处理领域长达14年的积累。
2009年,中科院博士镇立新推出名片全能王,凭借着“手机相机拍摄名片,自动完成识别、裁剪、归档”等功能,一炮而红。次年,扫描全能王于上线,让价格接近万元的扫描仪逐渐被手机里的软件替代。
回顾过去十多年间,扫描技术在中国普及率极大增强,实现了从“移动化”到“智能化”的飞跃性进阶,其中离不开扫描全能王团队的无数次功能迭代。
据统计,过去的十多年里,国内外市场上曾出现超过上千个文档扫描类产品,2010年上线的扫描全能王是最早将扫描技术应用于手机等移动端的APP之一,用户遍及200多个国家和地区,至今仍在多项工具类、商务类APP榜单中保持着第一的排名,为3亿用户带去便利。
“基于过去十多年的技术和数据积累,我们对于产品能够引领行业进步是非常的有信心的。”
“首先技术方面是我们始终会大力投入保持领先,其次在技术发展的过程中,我们最关注的还是用户碰到的问题,以及使用体验中不满意的地方。”扫描全能王总经理曹超阳介绍称,技术突破和用户使用痛点、需求场景的更新是扫描全能王产品持续升级的方向。
采写:南都记者马宁宁发自上海