java提取html标签信息里面的内容并排好序

例如以下代码:
<TR><TD><A HREF="http://www.dsaf1.com">./src/aaa.java (88%)</A>
<TD><A HREF="http://www.dsaf2.com">./src/bbb.java (88%)</A>
<TD ALIGN=right>35
<TR><TD><A HREF="http://www.dsaf3.com">./src/ccc.java (89%)</A>
<TD><A HREF="http://www.dsaf4.com">./src/ddd.java (89%)</A>
<TD ALIGN=right>30
<TR><TD><A HREF="http://www.dsaf5.com">./src/fff.java (86%)</A>
<TD><A HREF="http://www.dsaf6.com">./src/ggg.java (86%)</A>
<TD ALIGN=right>29
<TR>
提取出来的结果应该是
aaa.java 88% bbb.java 88% 35
ccc.java 89% ddd.java 89% 30
……
然后在根据百分比排序
结果应该是
ccc.java 89% ddd.java 89% 30
aaa.java 88% bbb.java 88% 35
……
求哪位大侠指定一二?

第1个回答  2013-11-16
提示 用正则表达式

public class RegexHtmlA{
public static void main(String[] args)throws Exception{
String content="<TR><TD><A HREF=\"http://www.dsaf1.com\">./src/aaa.java (88%)</A>";

String regx1="/src/(\\w*.\\w*).*\\((\\d*%)\\)";
Pattern p= Pattern.compile(regx1);
String text=content.toString();
Matcher macher =p.matcher(text);
while(macher.find()){
System.out.println(macher.group(1)+"/"+macher.group(2));
}
}
}追问

你还少提取了1个数字,能在写详细一点吗

第2个回答  2013-11-16
正则表达式提取一下地址处理一下,然后排序就可以了追问

排序我真的不知怎么排序,而且我真的提取不出来,写下代码吧,大哥

相似回答