在图像中定位文本-IGI

时间：2020-03-05 18:37:39 　来源:igfitidea点击:

我目前正在从事一个项目，我的目标是在图像中定位文本。到目前为止，OCR'ing文本并不是我的意图。我想基本上获取图像中文本的边界。我正在使用AForge.Net成像组件进行操作。在某种意义上有帮助吗？

更新2/5/09：
从那以后，我在项目中走了另一条路。但是，我确实尝试使用MODI(Microsoft Office Document Imaging)获取文本。它使我们可以轻松地对图像进行OCR识别并从中提取文本。

解决方案

这是一个活跃的研究领域。从字面上看，有很多关于该主题的学术论文。如果没有更多细节，将很难为我们提供帮助。我们在寻找特定类型的文字吗？字体？仅限英语？我们熟悉学术文献吗？

在任何OCR(光学字符识别)系统中，"文本检测"都是一个标准问题，因此，在互连网上有很多处理它的代码。

我可以开始列出来自Google的大量链接，但是我建议我们只是搜索"文本检测"并开始阅读:)。也有足够的示例代码。

识别图像中的文本确实是该领域研究人员的热门话题，但是直到验证码成为防御垃圾邮件机器人的"规范"时才开始失控。为什么要使用验证码作为保护？很好，因为很难(很难)定位(读取)图像中的文本！

我提到验证码的原因是，最大的进步是在这个很小的区域内完成的，我认为解决方案最好在那儿找到。
特别是因为验证码确实是关于在混乱的图像中定位文本(或者类似文本的东西)，然后再尝试正确读取字母。

因此，如果我们可以找到一个很好的开放源代码验证码破解工具，则我们可能拥有继续进行任务所需要的一切...
我们甚至可能会丢弃处理字符识别本身的最困难的代码，因为这些OCR用于读取变形的文本，而我们不必这样做。

*："非研究者"在可见，可用和实用信息方面的进步

如果我们可以使用在线API，那么http://www.wisetrend.com/wisetrend_ocr_cloud.shtml上的API除了可以进行OCR之外，还可以进行文本检测。