在图像中定位文本
我目前正在从事一个项目,我的目标是在图像中定位文本。到目前为止,OCR'ing文本并不是我的意图。我想基本上获取图像中文本的边界。我正在使用AForge.Net成像组件进行操作。在某种意义上有帮助吗?
更新2/5/09:
从那以后,我在项目中走了另一条路。但是,我确实尝试使用MODI(Microsoft Office Document Imaging)获取文本。它使我们可以轻松地对图像进行OCR识别并从中提取文本。
解决方案
回答
这是一个活跃的研究领域。从字面上看,有很多关于该主题的学术论文。如果没有更多细节,将很难为我们提供帮助。我们在寻找特定类型的文字吗?字体?仅限英语?我们熟悉学术文献吗?
在任何OCR(光学字符识别)系统中,"文本检测"都是一个标准问题,因此,在互连网上有很多处理它的代码。
我可以开始列出来自Google的大量链接,但是我建议我们只是搜索"文本检测"并开始阅读:)。也有足够的示例代码。
回答
识别图像中的文本确实是该领域研究人员的热门话题,但是直到验证码成为防御垃圾邮件机器人的"规范"时才开始失控。为什么要使用验证码作为保护?很好,因为很难(很难)定位(读取)图像中的文本!
我提到验证码的原因是,最大的进步是在这个很小的区域内完成的,我认为解决方案最好在那儿找到。
特别是因为验证码确实是关于在混乱的图像中定位文本(或者类似文本的东西),然后再尝试正确读取字母。
因此,如果我们可以找到一个很好的开放源代码验证码破解工具,则我们可能拥有继续进行任务所需要的一切...
我们甚至可能会丢弃处理字符识别本身的最困难的代码,因为这些OCR用于读取变形的文本,而我们不必这样做。
*:"非研究者"在可见,可用和实用信息方面的进步
回答
如果我们可以使用在线API,那么http://www.wisetrend.com/wisetrend_ocr_cloud.shtml上的API除了可以进行OCR之外,还可以进行文本检测。