python爬虫抓下来的网页，中间的中文乱码怎么解决

如题所述

举报该问题

推荐答案 2016-03-22

Pythonåç¨åºååæ¯ææè¿æ¥çåç¬¦ä¸²(è¯»æä»¶ï¼ç¬ç½é¡µ)ï¼ä¸è¿æ¥å°±decodeï¼å¤çå®ä¹åå¨è¦è¾åºçå°æ¹å¨encodeãé¢ä¸»è¯»å¥(read)åè¾åº(print)å¨ä¸è¡éï¼è¦å¨winä¸é¢æ³ä¸åºéå°±è¿ä¹å
print response.decode('utf-8').encode('gbk')

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/7Ozvj7WvvBBWtBOvBv.html

其他回答

第1个回答 2018-03-11

假如你使用的是requests的库。
response = requests.get(url,headers = headers)# url是你想抓的网站

然后使用语句response.encoding = 'utf-8'('gbk') # 这个视你的网页的源代码的charset格式决定
然后就随便使用吧，不会出现那种16进制的字节码了。

相似回答

大家正在搜