渴求OCR文字识别技术支持,该怎么解决
渴求OCR文字识别技术支持
前一段时间拿到毕业设计的题目《OCR文字识别系统设计》,当时头脑一片茫然~~~
要求实现图文转换,主要指将常用图像(.bmp|.jpg|.gif|.pdf)中的文字信息提取到常用文档(.txt|.doc|)中,识别效率要求为80%。开发工具自选。
从来没接触过这个东东,真不知如何下手。
望各位高手不吝传授相关知识与技术。
------解决方案--------------------
自己把字库的信息都读进来,图片里面的字的字体,大小,格式得一摸一样,而且然后一个点一个点的去对,看看大概百分之多少是匹配的,然后给个阈值,超过这个阈值的就认为是匹配的了。
以上是最理想的状态了,自己在画图板里面写几个字进去,而且位置,颜色也最好固定。不理想的状态就是你得自己做文字定位,二值化处理,还有模糊识别。。。
要是让你识别扫描的图片,可以明确的告诉你这个识别率是不可能达到的。
------解决方案--------------------
前一段时间拿到毕业设计的题目《OCR文字识别系统设计》,当时头脑一片茫然~~~
要求实现图文转换,主要指将常用图像(.bmp|.jpg|.gif|.pdf)中的文字信息提取到常用文档(.txt|.doc|)中,识别效率要求为80%。开发工具自选。
从来没接触过这个东东,真不知如何下手。
望各位高手不吝传授相关知识与技术。
********************************************************************************
系统设计:版面分析-文字分割-单字归一化-图象预处理(包括二值化,去噪,倾斜纠正等)-特征提取-分类识别
任何一个步骤都可以作为研究课题了.你们老师应该指定某一小块让你实现以下,起这么大的题目都可以做博士论文了
------解决方案--------------------
你可以到www.chinaocr.net上找找资料。也许能帮助你的。www.chinaocr.net是关注OCR技术的专业网络媒体。
------解决方案--------------------
要是懂的话不会很难,一般毕业设计只要能满足主要要求就行了,你可以简化目标的,
前一段时间拿到毕业设计的题目《OCR文字识别系统设计》,当时头脑一片茫然~~~
要求实现图文转换,主要指将常用图像(.bmp|.jpg|.gif|.pdf)中的文字信息提取到常用文档(.txt|.doc|)中,识别效率要求为80%。开发工具自选。
从来没接触过这个东东,真不知如何下手。
望各位高手不吝传授相关知识与技术。
------解决方案--------------------
自己把字库的信息都读进来,图片里面的字的字体,大小,格式得一摸一样,而且然后一个点一个点的去对,看看大概百分之多少是匹配的,然后给个阈值,超过这个阈值的就认为是匹配的了。
以上是最理想的状态了,自己在画图板里面写几个字进去,而且位置,颜色也最好固定。不理想的状态就是你得自己做文字定位,二值化处理,还有模糊识别。。。
要是让你识别扫描的图片,可以明确的告诉你这个识别率是不可能达到的。
------解决方案--------------------
前一段时间拿到毕业设计的题目《OCR文字识别系统设计》,当时头脑一片茫然~~~
要求实现图文转换,主要指将常用图像(.bmp|.jpg|.gif|.pdf)中的文字信息提取到常用文档(.txt|.doc|)中,识别效率要求为80%。开发工具自选。
从来没接触过这个东东,真不知如何下手。
望各位高手不吝传授相关知识与技术。
********************************************************************************
系统设计:版面分析-文字分割-单字归一化-图象预处理(包括二值化,去噪,倾斜纠正等)-特征提取-分类识别
任何一个步骤都可以作为研究课题了.你们老师应该指定某一小块让你实现以下,起这么大的题目都可以做博士论文了
------解决方案--------------------
你可以到www.chinaocr.net上找找资料。也许能帮助你的。www.chinaocr.net是关注OCR技术的专业网络媒体。
------解决方案--------------------
要是懂的话不会很难,一般毕业设计只要能满足主要要求就行了,你可以简化目标的,