用jsoup方式解析html,但是遇到了个问题,,因为html没学好,出现了这么种情况:我要提取html中的数据,提取内容在一个<p class ="xg1">的标签中,获取数据的代码为:
Elements e2 = doc.getElementsByClass("xg1");
但是,,网页源代码中存在的<p>标签classname为xg1的不止一个,有的甚至有双重类属性比如:
<p class="hm xg1",而我又只需要这一条,我应该怎么写代码?或者说这种情况根本无法通过抓Class属性获取数据?
从父级不同点来定位,比如:
<div id=“id1”><p class ="xg1">XXXX</div>要定位第一个可以:
Elements e2 = doc.Select("div#id1>p.xg1");请问“div#id1>p.xg1”的#和>号都是什么意思,,我问这个问题其实主要是想学这语法,,你给我讲解下呗。再跟你5分,,因为你说的东西就是我想要的,谢谢啦
这个网站我看过,内容是很不错,,但是总觉得不是太全,可能是我要求太高呵呵
追答要仔细看,上面都有,看懂了基本用jsoup没什么问题,关键是要看懂理解。看过了不会用,说明没看懂,呵呵