• 欢迎访问爱乐网,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站,欢迎加入爱乐网的大家庭
  • 如果您觉得爱乐网非常符合您的胃口,那么赶紧使用Ctrl+D 将爱乐网加入浏览器收藏夹吧

百度Q3期间_图像技术获突破_OCR斩获多项第一

互联网 爱乐网 2年前 (2016-10-25) 2935次浏览 0个评论 扫描二维码

2016 年 Q3 期间,百度文字识别(OCR)基于两项最新的深度学习技术,在文字检测和识别方面取得了重大突破,并在国际文档分析与识别大会(ICDAR)最具挑战性的自然场景类文字识别任务中,斩获五项冠军,远超其余参赛者,并积极推进技术在产品端应用。
对焦自然场景原图、检测、识别图示
ICDAR 由国际模式识别协会举办,是全球文档分析与模式识别领域最重要的国际学术会议之一。该会议自成立以来,先后吸引了来自美国、德国、中国、法国、新加坡、俄罗斯、日本、韩国、印度等十多个国家近三十支科研院所、高校和科技公司参加。

ICDAR 竞赛中有两个最具挑战的 OCR 竞赛任务:Challenge 2: “Focused Scene Text”(自然场景对焦文字识别)以及 Challenge 4: “Incidental Scene Text”(自然场景随拍文字识别)。这两个任务中的图片都来源于用户拍摄的自然场景图像,例如真实的街道和商场场景,由于待检测和识别的文字处于复杂的自然场景中,且待识别的文字往往有各种各样字体格式,文字的检测和识别具有较大的挑战性。对焦文字识别(Challenge 2)任务中,文字相对较为清晰,图片的拍摄角度尽量保证了文字处于水平的位置,随拍文字识别(Challenge 4)任务的难度更大,图片拍摄并不是专门针对文字区域进行的,存在噪声、模糊以及角度倾斜等不利因素。百度 OCR的算法在这两个场景上,检测和识别两个核心技术步骤均取得了世界第一。特别是在随拍场景(Challenge 4)任务中,百度 OCR技术的检测、识别、端到端系统,均大幅度领先第二名的指标,检测系统指标达到 75.01%,超越第二名 3.5%;识别系统 68.27%,超越第二名 6%;端对端技术的识别准确率达到 64%,优于第二名 10.7%。
随拍自然场景(Challenge 4)检测指标对比
随拍自然场景(Challenge 4)识别指标对比
对焦自然场景(Challenge 2)检测指标对比
对焦自然场景(Challenge 2)识别指标对比
随拍自然场景(Challenge 4) 端到端指标对比
OCR 是计算机视觉领域的经典问题,该技术诞生之后,传统的实体文本资料就可以快速地实现数字化,大大提升数据录入和处理效率。作为智能计算机感知世界的入口级技术,OCR 的科技应用价值也越来越重要,长期以来一直受到学术界和工业界的持续关注。近几年,Google、Microsoft、Amazon 等大型互联网公司以及旷视科技(拥有 Face++、Image++)等计算机视觉技术创业公司都在 OCR 技术上耕耘多年,且逐步将该技术应用于自身产品及业务中,提升产品体验的同时,也创造了巨大的商业价值。随拍自然场景原图、检测、识别图示
通过深度学习技术的不断优化,OCR 技术已经成为百度图像识别技术的重要功能之一,并成功地应用于多款产品中,如手机百度、百度翻译、百度地图、百度贴吧、百度图片、百度钱包、图片广告系统、百度词典、涂书笔记等。除此之外,OCR 还在文档图片录入和检索、自然场景输入、网图推荐和反作弊等应用场景中发挥重要作用。百度地图运用 OCR 技术,自动识别采集全景图片中的信息,实现地图数据快速更新,效率大幅提升。目前,百度 OCR 支持中、英、日、韩、葡、德、法、意、西、俄等十国语言,且通过百度开放云对外开放,以满足中小企业对图像文本识别技术的需求。百度翻译图像翻译功能
随着技术的进一步优化,OCR 技术将逐步走向产业化发展,更多的投向日常的生产及生活中。以医疗为例,就医过程中常用的诊断书、药品清单、体检表等均有望实现拍照录入系统,快速实现数字化就医,提高看病效率。不仅如此,OCR 技术还可应用于无人车、盲人导航、工业自动化、互联网信息挖掘、电商打假等多个领域。未来,百度将充分利用自身大数据及人工智能技术优势,快速提升 OCR 技术性能,将该技术应用于互联网的更多领域,创造更大的商业价值。


爱乐网(http://aile.so) , 版权所有丨如未注明 , 均为原创丨爱乐网采用BY-NC-SA协议进行授权 , 转载请注明:百度 Q3 期间 _ 图像技术获突破 _OCR 斩获多项第一
爱乐网淘券特价商品推荐
喜欢 (0)
[]
分享 (0)
爱乐网
关于作者:
爱乐网,专注互联网最新科技资讯分享,汇集各种软件教程、游戏攻略,为用户收集整理各类破解软件、正版软件、小工具的软件下载网站,永久网址:http://aile.so
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到