用正则表达式得到某个div标签内部的div标签中的内容

我要从<div id="right_news_content" class="float_l"> <DIV>各相关老师：</DIV></div>里面得到 "<DIV>各相关老师：</DIV>"正则表达式该怎么写？如果是想要得到"各相关老师："那么我知道正则是 <DIV>(.*)</DIV> 但是要取出某个div直接嵌套在里面的div内容就不知道怎么写了求大神解答

举报该问题

推荐答案推荐于2018-03-07

你这问题，和之前某人的一样。
先说结论：极度不推荐你使用这样的正则去从html中提取相关内容。

原因：
除非，你确保你的代码，使用正则表达式去匹配html内容的代码，所需处理的html是很简单的，内容很少的，嵌套很少的，否则，稍微复杂点的html代码，N多标签，甚至本身html就是不完整的，标签有误的。那么通过写正则表达式去处理的话，就是极其繁琐，效率比较低的。

比较好的做法是：
使用相关的，专门解析html的库去处理html

比如Python中，使用BeautifulSoup：
【总结】Python的第三方库BeautifulSoup的使用心得

其他语言，也有其他对应的处理html的库。

单独对于你这个，特定的，相对比较简单的，只有一级内部嵌套的div的写法，可以写成：
Python

"<div[^>]+>.+?<div>(.+?)</div></div>", re.I
其中re.I表示不区分大小写

PHP/Perl等
#<div[^>]+>.+?<div>(.+?)</div></div>#i
或
/<div[^>]+>.+?<div>(.+?)<\/div><\/div>/i

总之，还是不推荐用正则处理复杂的html。

刚专门给你写了个帖子，自己去看吧：
【整理】关于用正则表达式处理html代码方面的建议

（此处不能贴地址，请用google搜标题，即可找到帖子地址）

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/ejjOBXBee.html

其他回答

第1个回答 2012-11-20

var strs='<div id="right_news_content" class="float_l"> <DIV>各相关老师：</DIV></div>';
var ex=/class=\"float\_l\">(.*?<\/DIV>)/;
alert(ex.exec(strs)[1]);

相似回答

大家正在搜