Python2.7 request.get抓取网页，中文乱码怎么破

如题所述

举报该问题

推荐答案 2016-08-16

解码

解码方式多种

有时候网页也是用多种编码写的

data = data.decode('UTF-8','ignore') #('UTF-8')('unicode_escape')('gbk','ignore')

多种编码自己换着来看吧

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/BB77tOjXO77WB7OvWv.html

相似回答

python2.7打印中文乱码怎么办答：由于python默认以ASCII编码，所以不支持中文。所以我们需要在代码前面写上“#_*_ coding:utf-8 _*_”或者#coding=utf-8.当然，如果你代码中没有中文，就不需要加上了。还有一个原因，由于python所运行的操作系统决定的，windows默认的编码方式是GBK编码，所以这也是一个导致中文乱码的原因之一。建...

为什么python用requests.get获取后,不能用content或者text查看内容...答：大部分情况建议使用.text，因为显示的是汉字，但有时会显示乱码，这时需要用.content.decode('utf-8')，中文常用utf-8和GBK，GB2312等。这样可以手工选择文字编码方式。所以简而言之，.text是现成的字符串，.content还要编码，但是.text不是所有时候显示都正常，这是就需要用.content进行手动编码。

python怎么抓取网页中DIV的文字答：1）确定网络中需要的信息，打开网页后使用F12打开开发者模式。在Network中可以看到很多信息，我们在页面上看到的文字信息都保存在一个html文件中。点击文件后可以看到response，文字信息都包含在response中。对于需要输入的信息，可以使用ctrl+f，进行搜索。查看信息前后包含哪些特定字段。对于超链接的提取，可以...

毕业生必看Python爬虫上手技巧答：1、基本抓取网页 get方法 post方法 2、使用代理IP 在开发爬虫过程中经常会遇到IP被封掉的情况,这时就需要用到代理IP; 在urllib 2包中有Proxy Handler类, 通过此类可以设置代理访问网页,如下代码片段: 3、Cookies处理 cookies是某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加...

sublime text3中文乱码怎么解决方法答：1、打开sublime text3，按windows：Ctrl+～;mac：control+~打开控制行，复制粘贴以下python代码，然后回车运行。import urllib.request,os,hashlib; h = '7183a2d3e96f11eeadd761d777e62404e330c659d4bb41d3bdf022e94cab3cd0'; pf = 'Package Control.sublime-package'; ipp = sublime.installed_...

毕业生必看Python爬虫上手技巧答：1、基本抓取网页 get方法 post方法 2、使用代理IP 在开发爬虫过程中经常会遇到IP被封掉的情况，这时就需要用到代理IP；在urllib 2包中有Proxy Handler类，通过此类可以设置代理访问网页，如下代码片段：3、Cookies处理 cookies是某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据...

大家正在搜

python爬虫抓下来的网页，中间的中文乱码怎么解决

Python+requests 爬取网站遇到中文乱码怎么办

Python2.7 request.get抓取网页，中文乱码...

Python2.7 request.get抓取网页，中文乱码...

python 用requests获取网页源代码为什么中文显示...

python爬虫抓取到的数据用网页打开时是乱码，怎么解决

python爬虫抓下来的网页，中间的中文乱码怎么解决

python3爬虫抓取网页乱码怎么解决