pandas系列之导出为.csv文件

如题所述

第1个回答  2024-09-19

本文所用表格内容如下:

商品信息表

1.设置导出路径

和前面保存为.xlsx差不多,只是.csv文件的路径是通过path_or_buf参数设置的

importpandasaspdgoods_df=pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')goods_df.to_csv(path_or_buf='test.csv')

result:

保存前:

保存后:

注意事项和导出.xlsx文件的注意事项一致.如果同一导出文件已经在本地打开,则不能再次运行导出代码,需要将本地文件关闭以后再次运行导出代码。

2.设置索引

上面导出文件中关于索引的参数都是默认的,也就是没有对索引有什么限制,但是我们可以看到index索引使用的是从0开始的默认自然数索引,这种索引可以通过设置参数index=False在导出时去掉该索引、

goods_df=pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')goods_df.to_csv(path_or_buf='test.csv',index=False)

result:

设置前:

设置后:

3.设置要导出的列

有的时候一个表的列数很多,只需要导出部分列的内容。这个时候可以通过设置columns参数来指定要导出的列

goods_df=pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')goods_df.to_csv(path_or_buf='test.csv',index=False,columns=['分类','名称'])

result:

设置导出列之前:

设置导出列之后:

4.设置分隔符号

分隔符号就是用来指明导出文件中的字符之间是用什么来分隔的,默认使用逗号分隔,常用的分隔符号还有空格、制表符、分号等。分隔符号使用参数sep来指定

importpandasaspdgoods_df=pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')goods_df.to_csv(path_or_buf='test.csv',index=False,columns=['分类','名称'],sep=';')

result:

5.缺失值处理

虽然数据预处理阶段已经有缺失值的处理了,但是数据分析过程中可能也会产生缺失值,所以导出时仍然需要处理缺失值。

goods_df=pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')goods_df.to_csv(excel_writer='test.xlsx',sheet_name='测试文件',index=False,columns=['分类','名称'],encoding='utf-8',na_rep=0)

result:

原始表格

缺失值处理后:

6.设置编码格式

python3中,导出为.csv文件时,默认编码为UTF-8.如果使用默认的utf-8编码格式,导出的文件在本地电脑打开以后中文会乱码,所以一般使用utf-8-sig或者gbk编码

goods_df=pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')goods_df.to_csv(excel_writer='test.xlsx',sheet_name='测试文件',index=False,columns=['分类','名称'],encoding='utf-8')

logo设计

创造品牌价值

¥500元起

APP开发

量身定制,源码交付

¥2000元起

商标注册

一个好品牌从商标开始

¥1480元起

公司注册

注册公司全程代办

¥0元起

    官方电话官方服务
      官方网站八戒财税知识产权八戒服务商企业需求数字市场
相似回答