如何用java中HTMLPraser提取网页源代码中的某些链接

举一个例子,
如果网页源代码中有这样的代码
<a href="forum.php?mod=viewthread&tid=214172&extra=page%3D1" onclick="atarget(this)" class="s xst">博士视频讲师,1小时180+</a>
<a href="forum.php?mod=viewthread&tid=215520&extra=page%3D1" onclick="atarget(this)" class="s xst">周日2月1日麦颂KTV唱歌交友活动通知</a>
等等类似的,但是还有其他链接,我想要提取每一个href后面表示的链接
应该怎么用HTMLPraser
这里好像没什么标签
由于初学这里
希望大家可以予以解答疑问
谢谢啦~~

使用正则表达式去匹配就行了。
第一步:下载你需要分析的网页的源码
第二步:在程序中使用正则表达式去匹配源码,保存匹配成功的链接地址就行。
可以在网上搜一下匹配网址的正则表达式追问

网上有好多,哪一个才是正确的
那些表达式可以匹配所有网址吗?
麻烦你给我一个可以匹配这个的正则表达式,行吗?
谢谢你

温馨提示:答案为网友推荐,仅供参考
第1个回答  2015-03-05
直接使用正则去匹配捕获就行,不用那么麻烦哈追问

能不能告诉我怎么用
我还没有学过正则表达式。。。
就这个链接给个例子行么
谢谢你

相似回答