请问yolov4算法中读取xml标签文件,要存为什么形式以供训练?
问题描述:
复现yolov4算法,在预处理数据集的时候遇到了问题,
我的想法是读取xml文件,把真实框的坐标信息放进列表以供训练使用,
但我发现每张图的目标数量不一样,有的xml文件只有一个目标,
有的有好多,然后就得到了形状不一样的列表,请问正常xml是怎样处理的?
[[232, 130, 81, 118, 14], [246, 207, 271, 223, 12]]#第一个xml文件的信息,[x y w h 类别]
[[253, 183, 162, 143, 6]]#第二个xml文件的信息,[x y w h 类别]
答
可以学一学yolov5的做法,就是coco数据集的格式,可以看看这个https://blog.csdn.net/u014297502/article/details/109596057
这个v4的数据集https://blog.csdn.net/weixin_38353277/article/details/105841023
最后的格式就是:类别 后面4个归一化的矩形框参数。看你目前基本上都有类别和矩形框参数了,那就直接偷懒,写个脚背转换一下就是了