在哪里可以找到用于整体单词识别的算法详细信息?我需要在硬件(实际上是FPGA)中构建一个简单的OCR系统,科学期刊似乎是如此抽象?
是否有用于整体单词识别的开源(开放核心)代码?
谢谢
对于非常适合FPGA实现(令人尴尬的并行)的算法,您可以查看:
http://en.wikipedia.org/wiki/Cross- correlation
它快速且易于实现。
唯一的是:它可以识别形状(在您的情况下为某些文本),取决于旋转和大小/拉伸/偏斜等。但是,如果这不是问题,它可以非常快速且非常可靠。您只应注意类似字符(例如o和c)的解释问题。
我使用它在扫描的表单上查找默认文本,以获取感兴趣区域所在的方位,并且使用我们在单线程上在Core2 CPU上实现的图像搜索(600万像素)仅花费了大约15毫秒。