有N个HTM网页,里面的内容如下:</p><div class="image" purpose="image"><table><tr><td><img class="break" src="00n5/GUID-B359BC15-D7AF-48AC-B3CA-D7F6D8AE05FF-web.gif" purpose="img" alt="识别可信度差" title="识别可信度差"></td></tr></table></div><p id="GUID-3236A6EC-80D3-4982-B7EA-A8BB74412525">
现在我想要是提取00n5/GUID-B359BC15-D7AF-48AC-B3CA-D7F6D8AE05FF-web.gif
并在前面加上http://www.hao123/
类似这样:http://www.hao123/00n5/GUID-B359BC15-D7AF-48AC-B3CA-D7F6D8AE05FF-web.gif
注:一个网页内容可能有好几个GIF文件,GIF文件名并不固定
谢谢
即提取所有GIF的连接并在前面加上固定网址
然后输出到一个TXT文本中
应该是http://www.hao123.com/
问题里面的少了个.com
第二次补充:先谢谢lovemezhoupeng,我测试了一下,只有一个文件的时候,可以读出连接,但只有一个连接出来,其他读不出来。还有就是有多个文件的时候,提示找不到GIF文件(我把你批处理的.jpg都改为.gif了)。希望你能改一下代码,可以输出多个文档里的多个连接。谢谢