我们会建议使用哪种软件在OCR(光学字符识别)之前进行图像增强？-IGI

时间：2020-03-06 14:48:58 　来源:igfitidea点击:

我们目前正在研究在提交OCR之前提高图像质量的方法。我们目前正在利用OCR引擎Nuance的(V15)的ScanSoft公司的API。我们正在研究Lead Tools，但此后决定将其转移到其他地方。与Lead Tools相关的许可成本太高了。首先，我们正在寻找简单的图像增强功能，例如：去偏斜，去斑点，线条去除，打孔去除，锐化等。我们正在运行.NET和Java软件的混合版本，但是Java解决方案将是首选。

解决方案

不知道这是否完全符合你们所需要的标准，但是也许我们应该看看一些Paint.Net API。我不知道提取他们的图像处理算法以用于项目有多么容易，但是我相信他们可以完成我们正在寻找的某些事情。再加上它与MIT许可证的开源项目，所以它应该是用于商业用途非常友好。

在KOFAX.com上对KOFAX VRS的研究

也许是JMagick，它是ImageMagick的开源Java接口。它以ImageMagick API中的Java本地薄接口(JNI)层的形式实现。它是根据LGPL许可的，因此它不应该是有问题的许可。

http://sourceforge.net/projects/jmagick/

Kofax非常适合进行预处理，但是对于我们正在谈论的清理类型，除非图像真的很差，否则可能会过大。除非专长是图像处理，否则我建议与提供图像清理和OCR的提供商合作，以便我们可以专注于实际增加的价值。

我们从ABBYY(ABBY SDK)获得了OCR开发套件的许可，并且发现它在图像处理和OCR方面都是一流的。该API相当广泛，示例应用程序，帮助和支持令人印象深刻。我绝对建议我们看看。

免责声明：我为Atalasoft工作

我们具有.NET的这些功能和运行时免版税许可。

http://www.atalasoft.com/products/dotimage/

我们还具有OCR组件，包括用于Abbyy，Tesseract等的.NET包装器以及可搜索的PDF生成(PDF文本顶部的图像)

我建议英特尔提供零成本的运行时许可。

取决于原始图像的数量和质量。托管代码和映像工具包可以使用，但如果要处理几百万个映像，它并不总是最好的解决方案。对于小批量和预算紧张的情况，我同意先前的海报，即Aforge，Paint.NET和其他开放源代码计算机视觉库等项目将可以解决问题。当然，如果结果没有改善，我们将自己动手...至少这使我们可以将所需的所有东西都放在一个应用程序下，而且成本低廉。

如果我们每个月要处理数十万张图像，那么我建议我们将流程分成较小的工作流程步骤，并对每个步骤进行微调，直到每张图像的成本尽可能接近零为止。我们会发现，OCR结果起初迅速上升，然后比我们预期的更快稳定下来。 (我不是OCR的一个大风扇，但它有它的地方)

我使用来自Recogniform的商用Windows产品，使用针对各种图像调整的脚本以批处理模式在OCR之前处理和清理图像。如果图像无法通过QC检验或者被OCR引擎拒绝，则可以使用Atalasoft工具包构建的自定义.NET应用程序手动对其进行"修复"。批量处理所有内容，仅触摸失败的内容。

我们会建议使用哪种软件在OCR(光学字符识别)之前进行图像增强？

解决方案

相关推荐

最近更新

标签

我们会建议使用哪种软件在OCR(光学字符识别)之前进行图像增强？

解决方案

相关推荐

流行的Web框架之间的主要区别是什么？

WM_GETMINMAXINFO，ptMaxSize无效

自动生成.NET单元测试

Eclipse：依赖性管理

相关推荐

最近更新

标签