python中运行报错AttributeError: 'NoneType' object has no attribute 'group'

在网上搜的一个用python来爬取网页图片的代码，但是可能是版本的缘故，好多地方都不太对，自己改掉一些错误之后还剩下下图这个错误，实在不知道该从何下手，加了好几个QQ群都是想我推广腾讯课堂的，问个问题没有一个人理我，贴吧发帖也没得到什么好的回复，希望您能直接把改好的代码告诉我。这是完整的源码htt--p://pan.--baidu.--com/s/1pKOt2Ld

举报该问题

推荐答案 2017-06-23

# coding=utf-8
import re
import sys
import time

import requests
from lxml import etree

import importlib
importlib.reload(sys)

#定义一个爬虫
class spider(object):
    def __init__(self):
        print('开始爬取内容。。。')

#getsource用来获取网页源代码
    def getsource(self,url):
        html = requests.get(url)
        return html.text

#changepage用来生产不同页数的链接
    def changepage(self,url,total_page):
        if re.search('index_(\d+)',url,re.S):
            now_page = int(re.search('index_(\d+)',url,re.S).group(1))   #可修改
        else:
            now_page = 0
        page_group = []
        for i in range(now_page,total_page+1):
            link = re.sub('index_\d+','index_%s'%i,url,re.S)       #可修改
            page_group.append(link)
        return page_group

#getpic用来爬取一个网页图片
    def getpic(self,source):
        selector = etree.HTML(source)
        pic_url = selector.xpath('//ul[@class="ali"]/li/div/a/img/@src')   #可修改
        return pic_url

#savepic用来保存结果到pic文件夹中
    def savepic(self,pic_url):
        picname=re.findall('(\d+)',link,re.S)    #可修改
        picnamestr = ''.join(picname)
        i=0
        for each in pic_url:
            print('now downloading:{}'.format(each))
            pic = requests.get(each)
            fp = open('pic\\'+picnamestr +'-'+str(i)+ '.jpg', 'wb')
            fp.write(pic.content)
            fp.close()
            i += 1

#ppic集合类的方法
    def ppic(self, link):
        print('正在处理页面：{}'.format(link))
        html = picspider.getsource(link)
        pic_url = picspider.getpic(html)
        picspider.savepic(pic_url)

if __name__ == '__main__':
    start = time.time()
    url = 'http://www.baidu.com/'   #可修改
    picspider = spider()
    all_links = picspider.changepage(url,3)     #可修改
    for link in all_links:
        picspider.ppic(link)
    end = time.time()
    print('耗时:{}'.format(start-end))

代码质量很一般，都懒得细看了，直接给你加了个if判断。

建议看看嵩天教授的爬虫课，那个水平高一点。

追问

真的有用了，谢谢你，我会去看看你说的那个教授的课程，但是还想问一下：这个图片都保存在哪里啊？/尴尬

代码是有用了，但是不知道文件保存在何处😂

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/ztjW7zBeXWzeWtWvOe.html

相似回答

python2.7 BeautifulSoup3.2.0 findAll报错答：AttributeError: 'NoneType' object has no attribute 'findAll'意思是：此处的top_div是个空值，即在Python中是None，所以是NodeType 对于一个None的值，当然没有对应的findAll的方法了（只有正常的，非空的BeautifulSoup类型的变量才有此方法）所以推出：soup.find('div', {'id':'a'})获得值top_...

...NoneType' object has no attribute 'append'答：要知道，append方法是没有返回值的。也就是说，上述语句第一次会成功执行，并且将u_score赋值为None；第二次调用就会报错，因为None是不能调.append方法的，修改方法也简单，u_score.append(lose)就可以了，不要接返回值

...module' object has no attribute 'Tk'”是什么原因?答：python提示错误“AttributeError: 'module' object has no attribute 'Tk'”是设置错误造成的，解决方法为：1、打开命令行工具，进入python交互环境python。2、导入urllib包mport urllib。3、查看urllib包，包含的内容dir(urllib)help(urllib)从输出内容可以看出request.py是一个模块，如果是一个包的话会（...

...NoneType' object has no attribute 'xpath'?答：headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36'} data = requests.get(url,headers=headers).text 加一个头部就行了

运行python脚本时一直提示xx object has no attribute xx答：1、命名py脚本时，不要与python预留字，模块名等相同。2、删除该库的.pyc文件（因为py脚本每次运行时均会生成.pyc文件；在已经生成.pyc文件的情况下，若代码不更新，运行时依旧会走pyc，所以要删除.pyc文件），重新运行代码；或者找一个可以运行代码的环境，拷贝替换当前机器的.pyc文件即可。

...NoneType' object has no attribute 'text'?答：那是因为你的soup.find('div',id='info')没有拿到对象，所以导致.text出现了错误。

...NoneType' object has no attribute 'children'?答：属性错误：'NoneType' 对象没有属性 'children' ，这个错误提示告诉我们 'children' 属性的对象 soup 是一个空类型，那就意味着soup = BeautifulSoup(html,'html.parser')中soup并没有得到解析出来的html页面，那就是说在调用getHTMLText(url)函数时这个函数并没有得到url链接对应的网页信息。所以错误...

...NoneType' object has no attribute 'open_session',原因?_百...答：Python是纯粹的自由软件，源代码和解释器CPython遵循GPL(GNU GeneralPublicLicense)协议。Python语法简洁清晰，特色之一是强制用空白符(whitespace)作为语句缩进。Python具有丰富和强大的库。它常被昵称为胶水语言，能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是，...

...NoneType' object has no attribute 'CreateLayer'答：用该是'wind_farm'这个文件已经存在啦，删除原来的文件，再运行程序。

大家正在搜

nuget报错python pythonpopen会报错 python中升级pip报错 python不报错怎么运行不了 python函数运行不过也不报错 cdh报错python python中文报错 python报错killed python打开idle报错