java正则匹配html标签中的内容解决思路

java正则匹配html标签中的内容

例如:

<tr align="center"><td>一级</td><td>延误a</td><td>测试1</td><td></td></tr>

结果为:一级,延误a,测试1

<span align="left">提货abc少件</span>

结果为:提货abc少件

大神给个通用点的正则,获取里面的内容,急,在线等。谢谢

------解决思路----------------------
 
String s1 = "<tr align=\"center\"><td>一级</td><td>延误a</td><td>测试1</td><td></td></tr>";

System.out.println(s1.replaceAll(".*?<td>(.*?)</td><td>(.*?)</td><td>(.*?)</td>.*", "$1$2$3"));


String s2 = "<span align=\"left\">提货abc少件</span>";
System.out.println(s2.replaceAll(".*?<span.*[^>]>(.*?)</span>.*?", "$1"));

------解决思路----------------------
String reg = "<([^>]*)>";
String s = "<1>hhh<ac>a</sa>bbbbb<b></b>ccc<>";
Pattern pa = Pattern.compile(reg);
Matcher ma = pa.matcher(s);
StringBuffer sb = new StringBuffer();
boolean rs = ma.find();
while(rs){
ma.appendReplacement(sb, "");
rs = ma.find();
}
ma.appendTail(sb);
System.out.println(sb.toString());
这个才对