99问答网
所有问题
python爬虫抓下来的网页,中间的中文乱码怎么解决
如题所述
举报该问题
推荐答案 2016-03-22
Pythonåç¨åºååæ¯ææè¿æ¥çå符串(读æ件ï¼ç¬ç½é¡µ)ï¼ä¸è¿æ¥å°±decodeï¼å¤çå®ä¹åå¨è¦è¾åºçå°æ¹å¨encodeãé¢ä¸»è¯»å ¥(read)åè¾åº(print)å¨ä¸è¡éï¼è¦å¨winä¸é¢æ³ä¸åºéå°±è¿ä¹å
print response.decode('utf-8').encode('gbk')
温馨提示:答案为网友推荐,仅供参考
当前网址:
http://99.wendadaohang.com/zd/7Ozvj7WvvBBWtBOvBv.html
其他回答
第1个回答 2018-03-11
假如你使用的是requests的库。
response = requests.get(url,headers = headers)# url是你想抓的网站
然后使用语句response.encoding = 'utf-8'('gbk') # 这个视你的网页的源代码的charset格式决定
然后就随便使用吧,不会出现那种16进制的字节码了。
相似回答
大家正在搜
相关问题
python爬虫抓下来的网页,中间的中文乱码怎么解决
python3爬虫抓取网页乱码怎么解决
python爬虫抓下来的网页,中间的中文乱码怎么解决
python爬虫抓下来的网页,中间的中文乱码怎么解决
python爬虫抓下来的网页,中间的中文乱码怎么解决
python爬虫抓下来的网页,中间的中文乱码怎么解决
python爬虫抓取到的数据用网页打开时是乱码,怎么解决
python爬虫抓取到的数据用网页打开时是乱码,怎么解决