将网页源代码转换为xml解决办法
将网页源代码转换为xml
我现在需要将网页的源代码转换为xml,可是网页中有img这种不是成对出现的标签,所以我想请教大家如何处理呢。
我的思路是for循环查找然后在img标签后面添加一个</img>使其闭合,可是问题来了,因为html不小所以循环的话非常吗,所以请问大家有其他的办法吗?
------解决方案--------------------
我现在需要将网页的源代码转换为xml,可是网页中有img这种不是成对出现的标签,所以我想请教大家如何处理呢。
我的思路是for循环查找然后在img标签后面添加一个</img>使其闭合,可是问题来了,因为html不小所以循环的话非常吗,所以请问大家有其他的办法吗?
------解决方案--------------------