CTPN

CTPN

源码地址:https://github.com/eragonruan/text-detection-ctpn

该地址提供了 CTPN 的 tf 版本的实现,代码文档写得很详细,issue 里面也帮助解决了不少问题。

下面简单记录在复现训练的时候遇到的一些问题:

1、首先,必要的环境配置

2、可以尝试用已有的训练好的模型,运行 demo.py 测试一些图片

3、训练数据准备,按照作者的要求,将他已经准备好的数据(一定的格式)拷贝到data/ 目录下面,然后将对应的名字命名正确,能找到对应的文件

4、训练时, _image_summary  的位置报错,是作者为了提醒我们,用不同的TF版本,最终所用的函数名是有区别的,采用合适的版本即可

5、最后 VGG_imagenet.npy  文件时空 的,需要下载预训练好的model,放在指定的目录下面,来完成训练

总之,需要细心,报错之后按照错误,在git上或者Google 上搜索,总会找到解决方法。

 tf 不同版本的问题:https://github.com/CharlesShang/TFFRCNN/issues/25 (作者的代码中也有写到)--- (tf.image_summary should be renamed to tf.summary.image;)

https://github.com/eragonruan/text-detection-ctpn/issues/198  (VGG_imagenet.npy model 不可用)

demo中用到的预训练好的模型放在checckpoints 目录中