Amazon研究人员用AI提高曲线文本识别,测试准确度超过83%【鸭脖app官网登陆】

栏目:茶油

更新时间:2021-05-30

浏览: 30119

Amazon研究人员用AI提高曲线文本识别,测试准确度超过83%【鸭脖app官网登陆】

产品简介

光学文字识别(OCR)将手写或打印机文本的图像切换为机器可读文本,是可追溯到70年代初的技术。

产品介绍

本文摘要:光学文字识别(OCR)将手写或打印机文本的图像切换为机器可读文本,是可追溯到70年代初的技术。

光学文字识别(OCR)将手写或打印机文本的图像切换为机器可读文本,是可追溯到70年代初的技术。但是,由于长期以来OCR算法很难识别与水平面不平行的文字,Amazon的研究开发者开发了Texttubes这一技术。这是自然图像中曲线文本的检测器,可以将文本建模为包围其中轴线的管状。

在描述工作的论文中,合作者主张他们的方法在标准化的OCR基准上超过了最先进的设备。【照片来源:venturebeat所有者:venturebeat所】正如研究者说明的那样,场景文本一般分为文本检查和文本识别两个倒数任务。第一个是用于定位文字、单词和行,第二个是mRNA的内容。

两者都说在一起更容易,自然环境中的文本不仅受到变形的影响,也不受视点变化和字体的影响。该团队的解决方案是利用文本参照框架的管状表达形式,利用目标文本一般是大小相近的文字串联的事实,捕捉大部分可变性。与传统的方法相比,更容易重叠和产生噪音的矩形和四面形来捕捉文本信息,它被公式化为数学函数,需要训练机器学习场景文本检测器。研究人员在CTW-1500上评价了TextTubes的性能。

鸭脖app

CTW-1500是数据集,该数据集由自然场景和图像库收集的1500张图像(每张图像最少1个曲线例),最多10000个文本例构成。同时在Total-Text上展开评价,Total-Text包括约1255次训练图像、300个测试图像和一个或多个曲线文本实例。据报道,CTW-1500以83.65%的精度获得了业界领先的结果,最相似的方法精度为75.6%。对一个案例的中间轴和均值半径开展建模……能够捕捉到整个案例的信息。

这篇论文的年度出版者写道。在单词组成的数据集中,如Total-Text,我们的模式需要构建最先进的设备性能。在具备行级评论的数据集中,例如CTW-1500,我们的模型需要更好地捕捉例子中每个单词的文本信息。

如果有一天TextTubes需要使用的话,对于依赖OCR技术开展业务的企业来说,这可能是个好消息。据估计,80%以上的数字流程仍有纸张,约97%的中小企业仍在用于纸张支票。据GrandViewRearch的数据显示,到2025年,OCR解决方案市场的价值可能超过138亿8千万美元。

(公共编号:)viaVB原创文章允许禁止发表。下一篇文章发表了注意事项。


本文关键词:鸭脖app,鸭脖app官网登陆

本文来源:鸭脖app-www.bonbishop.com