带Tesseract接口的OCR
时间:2020-03-05 18:43:54 来源:igfitidea点击:
如何在C#中使用Tesseract的界面对tiff文件进行OCR?
目前,我只知道如何使用可执行文件来执行此操作。
解决方案
回答
源代码似乎适合于可执行文件,我们可能需要重新连接一些内容,以便将其构建为DLL。我没有使用Visual C ++的丰富经验,但我认为进行一些研究不应太难。我的猜测是有人可能已经制作了一个库版本,我们应该尝试使用Google。
在DLL文件中包含tesseract-ocr代码后,我们便可以通过Visual Studio将文件导入到Cproject中,并让其创建包装器类并为我们做所有编组工作。如果无法导入,则DllImport将允许我们从Ccode调用DLL中的函数。
然后,我们可以查看原始可执行文件,以找到有关调用哪些函数以正确OCR一张tiff图像的线索。
回答
看看tessnet
回答
免责声明:我为Atalasoft工作
我们的OCR模块支持Tesseract,如果证明还不够好,我们可以升级到更好的引擎,而只需更改一行代码即可(我们为多个OCR引擎提供了通用接口)。