毕业设计做一个从图片识别汉字和图形的程序如何样?难度大不大

毕业设计做一个从图片识别汉字和图形的程序怎么样?难度大不大?
  毕业设计想做一个基于图形图像处理的程序,就是从含有文字的图片中自动识别出汉字来,并存储到记事本。后期想加入图形的识别。 我想问一下这个程序的难度大不大?这种模式识别的技术现在国内发展的怎么样?
------解决思路----------------------
难度大不大,要看你的水平怎么样,所站的位置有多高。
珠穆朗玛峰很高,对于沿海的人来说,不过对于生活在西藏的人来说,看到的也就2000米高吧
------解决思路----------------------
很大,而且毕业设计一段时间做出来,也就能演示演示。
------解决思路----------------------
google 开源ocr
google 模式识别 清华大学出版社
------解决思路----------------------
文字比较简单  微软有个文字识别控件 ocr mfc使用 很简单。
 
图像比较难 没思路毕业设计做一个从图片识别汉字和图形的程序如何样?难度大不大
------解决思路----------------------
引用:
Quote: 引用:

难度大不大,要看你的水平怎么样,所站的位置有多高。
珠穆朗玛峰很高,对于沿海的人来说,不过对于生活在西藏的人来说,看到的也就2000米高吧

之前做过车牌识别,看过一些基本的算法,现在主要是不知道这个程序水深水浅,下了要忙着找工作了。想多加入一些自己的算法,拿个优秀毕业设计。


汉字识别应该蛮难的吧,那么多汉字呢。。。
------解决思路----------------------
有一个游戏外挂插件,大漠插件,你可以参考一下他的做法。

对于文字识别,将要被识别的图片按照文字的颜色二值化,将二值化数据转换成16进制特征。
将不同的文字,输出后按照文字所占用的像素,将文字的像素点阵进行二值化,然后将二值化的数据换成16进制的特征码。然后就是写一种支持横向,纵向越界分离,并且已经识别到的数据剥离出去的算法即可。模糊度的算法,可以在特征码长度的基础上,在循环时,允许 模糊度 * 特征长度的 的不匹配。

对于识别图片,就简单一些了,只需要一个支持横向,纵向越界分离的查找特征算法即可。

另外,文字识别,我研究过这个东西,我觉得可以把颜色二值化,然后让它真正意义上的二进制化,也就是1字节的内存可以保留8个二值化颜色数据,这样我觉得实现一些基础的匹配算法后在效率上会有非常大的提升,但别人是不是这么干的我就不知道了。

------解决思路----------------------
去 下载网页那边搜一下。
------解决思路----------------------
引用:
Quote: 引用:

Quote: 引用:

难度大不大,要看你的水平怎么样,所站的位置有多高。
珠穆朗玛峰很高,对于沿海的人来说,不过对于生活在西藏的人来说,看到的也就2000米高吧

之前做过车牌识别,看过一些基本的算法,现在主要是不知道这个程序水深水浅,下了要忙着找工作了。想多加入一些自己的算法,拿个优秀毕业设计。


汉字识别应该蛮难的吧,那么多汉字呢。。。

这个难度不在于汉字的多少。主要是字体,还有图像的复杂度。
------解决思路----------------------
这个做毕业设计有点难度,时间也比较长,西文的比东方语系好辨识,不过正如以下这位大神所说的,你如果水平很强,这也不是问题。
引用:
难度大不大,要看你的水平怎么样,所站的位置有多高。
珠穆朗玛峰很高,对于沿海的人来说,不过对于生活在西藏的人来说,看到的也就2000米高吧

------解决思路----------------------
引用:
Quote: 引用:

Quote: 引用:

Quote: 引用:

难度大不大,要看你的水平怎么样,所站的位置有多高。
珠穆朗玛峰很高,对于沿海的人来说,不过对于生活在西藏的人来说,看到的也就2000米高吧

之前做过车牌识别,看过一些基本的算法,现在主要是不知道这个程序水深水浅,下了要忙着找工作了。想多加入一些自己的算法,拿个优秀毕业设计。


汉字识别应该蛮难的吧,那么多汉字呢。。。

这个难度不在于汉字的多少。主要是字体,还有图像的复杂度。


需要考虑的问题还是蛮多的