如何用python遍历文件夹下的所有excel文件

如题所述

举报该问题

推荐答案 2017-11-04

大数据处理经常要用到一堆表格，然后需要把数据导入一个list中进行各种算法分析，简单讲一下自己的做法：

1.如何读取excel文件

网上的版本很多，在xlrd模块基础上，找到一些源码：

[python] view plain copy

import xdrlib ,sys

import xlrd

def open_excel(file="C:/Users/flyminer/Desktop/新建 Microsoft Excel 工作表.xlsx"):

data = xlrd.open_workbook(file)

return data

#根据索引获取Excel表格中的数据参数:file：Excel文件路径 colnameindex：表头列名所在行的所以，by_index：表的索引

def excel_table_byindex(file="C:/Users/flyminer/Desktop/新建 Microsoft Excel 工作表.xlsx",colnameindex=0,by_index=0):

data = open_excel(file)

table = data.sheets()[by_index]

nrows = table.nrows #行数

ncols = table.ncols #列数

colnames = table.row_values(colnameindex) #某一行数据

list =[]

for rownum in range(1,nrows):

row = table.row_values(rownum)

if row:

app = {}

for i in range(len(colnames)):

app[colnames[i]] = row[i]

list.append(app)

return list

#根据名称获取Excel表格中的数据参数:file：Excel文件路径 colnameindex：表头列名所在行的所以，by_name：Sheet1名称

def excel_table_byname(file="C:/Users/flyminer/Desktop/新建 Microsoft Excel 工作表.xlsx",colnameindex=0,by_name=u'Sheet1'):

data = open_excel(file)

table = data.sheet_by_name(by_name)

nrows = table.nrows #行数

colnames = table.row_values(colnameindex) #某一行数据

list =[]

for rownum in range(1,nrows):

row = table.row_values(rownum)

if row:

app = {}

for i in range(len(colnames)):

app[colnames[i]] = row[i]

list.append(app)

return list

def main():

tables = excel_table_byindex()

for row in tables:

print(row)

tables = excel_table_byname()

for row in tables:

print(row)

if __name__=="__main__":

main()

最后一句让代码里的函数都可以被复用，简单地说：假设文件名是a，在程序中import a以后，就可以用a.excel_table_byname()和a.excel_table_byindex()这两个超级好用的函数了。

2.然后是遍历文件夹取得excel文件以及路径：，原创代码如下：

[python] view plain copy

import os

import xlrd

import test_wy

xpath="E:/唐伟捷/电力/电力系统总文件夹/舟山电力"

xtype="xlsx"

typedata = []

name = []

raw_data=[]

file_path=[]

def collect_xls(list_collect,type1):

#取得列表中所有的type文件

for each_element in list_collect:

if isinstance(each_element,list):

collect_xls(each_element,type1)

elif each_element.endswith(type1):

typedata.insert(0,each_element)

return typedata

#读取所有文件夹中的xls文件

def read_xls(path,type2):

#遍历路径文件夹

for file in os.walk(path):

for each_list in file[2]:

file_path=file[0]+"/"+each_list

#os.walk()函数返回三个参数：路径，子文件夹，路径下的文件，利用字符串拼接file[0]和file[2]得到文件的路径

name.insert(0,file_path)

all_xls = collect_xls(name, type2)

#遍历所有type文件路径并读取数据

for evey_name in all_xls:

xls_data = xlrd.open_workbook(evey_name)

for each_sheet in xls_data.sheets():

sheet_data=test_wy.excel_table_byname(evey_name,0,each_sheet.name)

#请参考读取excel文件的代码

raw_data.insert(0, sheet_data)

print(each_sheet.name,":Data has been done.")

return raw_data

a=read_xls(xpath,xtype)

print("Victory")

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/zj7BWjteOXt7XtjX7B.html

相似回答

大家正在搜