【文/观察者网 周远方】
2021世界人工智能大会于7月8日-10日在上海世博展览馆召开 。
人工智能是上海落实国家战略部署、重点发展的三大先导产业之一 , 在这片沃土上 , 近年来人工智能领域出现了许多创新场景和前沿进展 。
合合信息作为上海本土科技企业代表 , 2019和2020年成功在世界人工智能大会举办金融科技落地论坛 , 并先后邀请两位诺贝尔奖获得者参与发言 。
【识别|合合信息:专注文字识别15年,“我们称得上人工智能行业老炮儿”】比起今天在人工智能赛道上叱咤风云、炙手可热的“四小龙”们 , 合合信息要低调得多 。
文章图片
图片来源:合合信息
“我们其实可以称得上人工智能行业的‘老炮儿’” , 合合信息董事汤松榕在接受观察者网采访时说道 , “2006年刚成立时 , 人工智能专业毕业的人其实是不太能找到好工作的 , 因为大家当时都不知道人工智能可以干什么 。 ”
但合合信息的创始团队是名副其实的正规军 , 大部分骨干来自摩托罗拉人工智能实验室的 , 创始人镇立新本人 , 则是中国科学院模式识别与智能系统专业的博士 。
我们作为一个技术驱动的团队 , 选定了人工智能文字识别的方向 , 就是十几年一直坚持不断地投入 。
“文字识别 , 也称为OCR , 是一个比较冷门的方向” , 汤松榕介绍 , 可能很多人觉得OCR是个非常开源的技术 , 像Google、百度、微软都发布了开源的OCR 。 但实际上 , 复杂场景下的文字识别技术难度很高 , 可能一份文件模糊到连肉眼无法分辨清楚 , 我们深度学习的人工智能技术能够把文档更清晰地识别出来 , 特别是在移动端 , 比如我们拍照过度曝光、反光、抖动、微弱光线等等情境下 , 我们拍出来的文件用传统OCR是无法识别的 , 我们解决的就是这种复杂场景下的文字识别能力 。
合合信息是第一个把AI文字识别技术应用到移动端的公司 , 2009年推出第一个产品“名片全能王” , 帮助商务人士捕捉名片上的信息 , 录入到通讯录中 。 就是这样的产品成为第一个帮助苹果手机跟商务社交领域打通的APP , 也给苹果用户带来更好的体验 。
15年默默的深耕 , 打磨出这次人工智能大会上的一大亮点 。
甲骨文作为我国最早的成熟文字、世界四大古文字之一 , 因刻写在龟甲和兽骨上而得名 。 目前 , 已出土的甲骨碎片多达16万余件 。 可惜的是 , 这些甲骨碎片被埋在地下多年 , 经历了地下活动的冲击和挖掘造成的磨损 , 多数甲骨残缺严重;又由于随着人类历史的迁徙遍布于世界各个角落 , 很难有完整的信息 。
文章图片
图片来源:合合信息
随着人工智能的引进 , 通过图像识别技术 , 可以进行甲骨的自动识别、撮合 , 为甲骨文学者的工作提质增效 。 目前 , 这一技术处于内测阶段并首次在人工智能大会上展示 , 安阳殷墟景区作为这一技术的学术支持单位 。
智能文字识别技术主要包含了智能图像处理 , 基于深度学习的复杂场景文字识别 , 自然语言处理三个核心技术层 。 智能图像处理技术主要对用户拍摄的复杂文档图像进行预处理 , 使得文档图像质量得到大幅度提升 。 例如对图像进行增强 , 让图像看起来更清晰 , 对形变图像进行还原矫正 , 对图像中因光照不均产生的阴影问题进行处理 , 对不同角度拍摄的图像进行定位和透视变换矫正 。 基于深度学习的复杂场景文字识别技术主要利用合合信息自研的手写印刷混排识别 , 抗强干扰识别 , 扭曲文字识别 , 复杂印章和手写识别等一系列先进深度学习识别技术来解决各种不同复杂场景下的文字识别问题 。 而自然语言处理技术 , 则是对识别出的结果进行进一步的语义理解 。
目前 , 合合信息的智能文字识别技术支持中、英、俄等56种语言的文档图像、100+种证件的快读智能分类 , 以及全球不同国家、不同行业的卡证、票据、定制识别等多个AI场景的产品和解决方案 。
推荐阅读
- 建设|这一次,我们用SASE为教育信息化建设保驾护航
- 产品|泰晶科技与紫光展锐联合实验室揭牌
- 最新消息|中围石油回应被看成中国石油:手续合法 我们看不错
- 识别|沈阳地铁重大变化!能摘口罩吗?
- 观测|期待!新年第一天火星合月,1月4日一起去看流星雨
- 识别|天津滨海机场RFID行李全流程跟踪系统完成建设 行李标签识别成功率可提升至99%
- 水星|期待!新年第一天火星合月,1月4日一起去看流星雨
- 上海|上海供水热线与城投水务官网合并上线,一站式服务更便民
- 领域|上海市电子信息产业“十四五”规划:以集成电路为核心先导
- Tencent|微信小程序新规则:调用个人敏感信息将需授权