python爬虫问题求解

这是某大神博客贴吧爬虫的代码,扣正则的

主要是不懂这个函数是什么作用。小白求指点

网页读出来以后是页面的源码。这个时候通过解析标签来解析页面。
这个就是你上面那段的意思。不懂的话上3w school去学一下页面的知识。

第二段的\n \t是换行符,没前没后的看不太懂。说一下换行符。Windows的换行符(也就是回车)是\n\t,Linux系统的换行符是\n。

第二段要是想说的更明白一点,需要多贴一点代码出来
希望能帮到你。追问

已经贴出了全部代码,扣正则总是不懂,求大大指点

温馨提示:答案为网友推荐,仅供参考
相似回答