CTPN

CTPN

源码地址：https://github.com/eragonruan/text-detection-ctpn

该地址提供了 CTPN 的 tf 版本的实现，代码文档写得很详细，issue 里面也帮助解决了不少问题。

下面简单记录在复现训练的时候遇到的一些问题：

1、首先，必要的环境配置

2、可以尝试用已有的训练好的模型，运行 demo.py 测试一些图片

3、训练数据准备，按照作者的要求，将他已经准备好的数据（一定的格式）拷贝到data/ 目录下面，然后将对应的名字命名正确，能找到对应的文件

4、训练时， _image_summary 的位置报错，是作者为了提醒我们，用不同的TF版本，最终所用的函数名是有区别的，采用合适的版本即可

5、最后 VGG_imagenet.npy 文件时空的，需要下载预训练好的model，放在指定的目录下面，来完成训练

总之，需要细心，报错之后按照错误，在git上或者Google 上搜索，总会找到解决方法。

tf 不同版本的问题：https://github.com/CharlesShang/TFFRCNN/issues/25 （作者的代码中也有写到）--- (tf.image_summary should be renamed to tf.summary.image;)

https://github.com/eragonruan/text-detection-ctpn/issues/198 （VGG_imagenet.npy model 不可用）

demo中用到的预训练好的模型放在checckpoints 目录中