怎么爬取网页的动态内容，很多都是js动态生成的内容o

如题所述

推荐答案 2017-03-10

String url = "http://xinjinqiao.tprtc.com/admin/main/flrpro.do";
try {
    WebClient webClient = new WebClient(BrowserVersion.FIREFOX_10);
    //设置webClient的相关参数
    webClient.getOptions().setJavaScriptEnabled(true);
    webClient.getOptions().setCssEnabled(false);
    webClient.setAjaxController(new NicelyResynchronizingAjaxController());
    //webClient.getOptions().setTimeout(50000);
    webClient.getOptions().setThrowExceptionOnScriptError(false);
    //模拟浏览器打开一个目标网址
    HtmlPage rootPage = webClient.getPage(url);
    System.out.println("为了获取js执行的数据线程开始沉睡等待");
    Thread.sleep(3000);//主要是这个线程的等待因为js加载也是需要时间的
    System.out.println("线程结束沉睡");
    String html = rootPage.asText();
    System.out.println(html);
} catch (Exception e) {
}

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/WezBeeBWvtWvt7Xjtjj.html

相似回答

大家正在搜