关于OCR汉字识别的方法讨论解决办法
关于OCR汉字识别的方法讨论
最近在写一款文档识别软件,前期的图像预处理(倾斜校正,单字切割等)都已经完成,现在已经开始要对切割出来的单字进行识别,不知道要用何种方式进行,查了资料有的说用BP神经网络,有的说模板匹配。。请坛子里面的大佬指点迷津!!万分感激!
------解决方案--------------------
最准确的方式是抽骨,再转化为笔画曲线信息,再从曲线信息库中匹配出相似度最高的。所谓的神经网络就是在其识别错误的情况下将其人为纠正,然后将纠正的数据保存。
------解决方案--------------------
既然已经切割出单字符了,直接应用开源的tesseract-ocr就可以
http://blog.****.net/fengbingchun/article/details/8493877
最近在写一款文档识别软件,前期的图像预处理(倾斜校正,单字切割等)都已经完成,现在已经开始要对切割出来的单字进行识别,不知道要用何种方式进行,查了资料有的说用BP神经网络,有的说模板匹配。。请坛子里面的大佬指点迷津!!万分感激!
------解决方案--------------------
最准确的方式是抽骨,再转化为笔画曲线信息,再从曲线信息库中匹配出相似度最高的。所谓的神经网络就是在其识别错误的情况下将其人为纠正,然后将纠正的数据保存。
------解决方案--------------------
既然已经切割出单字符了,直接应用开源的tesseract-ocr就可以
http://blog.****.net/fengbingchun/article/details/8493877