请问yolov4算法中读取xml标签文件，要存为什么形式以供训练？

问题描述：

复现yolov4算法，在预处理数据集的时候遇到了问题，

我的想法是读取xml文件，把真实框的坐标信息放进列表以供训练使用，

但我发现每张图的目标数量不一样，有的xml文件只有一个目标，

有的有好多，然后就得到了形状不一样的列表，请问正常xml是怎样处理的？

[[232, 130, 81, 118, 14], [246, 207, 271, 223, 12]]#第一个xml文件的信息，[x y w h 类别]
[[253, 183, 162, 143, 6]]#第二个xml文件的信息，[x y w h 类别]

答

可以学一学yolov5的做法，就是coco数据集的格式，可以看看这个https://blog.csdn.net/u014297502/article/details/109596057

最后的格式就是：类别后面4个归一化的矩形框参数。看你目前基本上都有类别和矩形框参数了，那就直接偷懒，写个脚背转换一下就是了