怎么正则提取匹配内容

如何正则提取匹配内容
字符串格式1:   http://www.com.cn   2007年02月02日15:47&nbsp;   <font   color=#A20010> 体育报 </font>
字符串格式2:   http://www.com.cn                   2007年02月03日01:07   <span   class= "linkRed02 "> <a   href= "http://www.thebeijingnews.com/ "   target= "_blank "   style= "text-decoration:none; "> 新京报 </a>     </span>

如何正则提取匹配的日期:2007年02月02日15:47,2007年02月03日01:07   和   报纸的中文名   体育报,新京报

------解决方案--------------------
^((\d{1,4})年(\d{1,2})月(\d{1,2})日(\d{1,2}):(\d{1,2}))$
[\u4e00-\u9fa5]{1,}

------解决方案--------------------
\d+年\d+月\d+日\d+:\d+或者\b\d+年\d+月\d+日\d+:\d+\b
报纸中文名要看特定的环境来匹配,如果都是像楼主所给在“> ”和“ <”之间的,可以用
(? <=> \s*)([\u4e00-\u9fa5]+?)(?=\s* <)