我们会建议使用哪种软件在OCR(光学字符识别)之前进行图像增强?
我们目前正在研究在提交OCR之前提高图像质量的方法。我们目前正在利用OCR引擎Nuance的(V15)的ScanSoft公司的API。我们正在研究Lead Tools,但此后决定将其转移到其他地方。与Lead Tools相关的许可成本太高了。首先,我们正在寻找简单的图像增强功能,例如:去偏斜,去斑点,线条去除,打孔去除,锐化等。我们正在运行.NET和Java软件的混合版本,但是Java解决方案将是首选。
解决方案
不知道这是否完全符合你们所需要的标准,但是也许我们应该看看一些Paint.Net API。我不知道提取他们的图像处理算法以用于项目有多么容易,但是我相信他们可以完成我们正在寻找的某些事情。再加上它与MIT许可证的开源项目,所以它应该是用于商业用途非常友好。
在KOFAX.com上对KOFAX VRS的研究
也许是JMagick,它是ImageMagick的开源Java接口。它以ImageMagick API中的Java本地薄接口(JNI)层的形式实现。它是根据LGPL许可的,因此它不应该是有问题的许可。
http://sourceforge.net/projects/jmagick/
Kofax非常适合进行预处理,但是对于我们正在谈论的清理类型,除非图像真的很差,否则可能会过大。除非专长是图像处理,否则我建议与提供图像清理和OCR的提供商合作,以便我们可以专注于实际增加的价值。
我们从ABBYY(ABBY SDK)获得了OCR开发套件的许可,并且发现它在图像处理和OCR方面都是一流的。该API相当广泛,示例应用程序,帮助和支持令人印象深刻。我绝对建议我们看看。
免责声明:我为Atalasoft工作
我们具有.NET的这些功能和运行时免版税许可。
http://www.atalasoft.com/products/dotimage/
我们还具有OCR组件,包括用于Abbyy,Tesseract等的.NET包装器以及可搜索的PDF生成(PDF文本顶部的图像)
我建议英特尔提供零成本的运行时许可。
取决于原始图像的数量和质量。托管代码和映像工具包可以使用,但如果要处理几百万个映像,它并不总是最好的解决方案。对于小批量和预算紧张的情况,我同意先前的海报,即Aforge,Paint.NET和其他开放源代码计算机视觉库等项目将可以解决问题。当然,如果结果没有改善,我们将自己动手...至少这使我们可以将所需的所有东西都放在一个应用程序下,而且成本低廉。
如果我们每个月要处理数十万张图像,那么我建议我们将流程分成较小的工作流程步骤,并对每个步骤进行微调,直到每张图像的成本尽可能接近零为止。我们会发现,OCR结果起初迅速上升,然后比我们预期的更快稳定下来。 (我不是OCR的一个大风扇,但它有它的地方)
我使用来自Recogniform的商用Windows产品,使用针对各种图像调整的脚本以批处理模式在OCR之前处理和清理图像。如果图像无法通过QC检验或者被OCR引擎拒绝,则可以使用Atalasoft工具包构建的自定义.NET应用程序手动对其进行"修复"。批量处理所有内容,仅触摸失败的内容。