创建DataFrame:10种方式任你选

如题所述

微信公众号:尤而小屋 作者:Peter 编辑:Peter


深入了解DataFrame数据结构


在系列文章的前期,我们已经探讨了pandas中的关键数据结构,包括Series和DataFrame。DataFrame是pandas的核心,几乎所有的后续内容都将围绕其操作展开。掌握DataFrame的创建至关重要。


以下是创建DataFrame的十种方法,主要借助函数 pd.DataFrame():


创建方法


1. 创建空DataFrame

直接创建一个空的DataFrame,虽然输出为空,但类型显示为DataFrame。


2. 填充NaN值

通过设置值为NaN,可以创建包含缺失数据的DataFrame。


手动创建

逐列构建DataFrame,将数据以列表的形式组织。


2.1 读取本地文件

包括CSV、Excel、JSON和TXT文件,如成都美食CSV数据和JSON数据的导入。


3. 读取数据库

借助pymysql,连接数据库后提取数据,如Student表的读取。


4. 字典创建

使用字典构建,包括单层和嵌套字典,以及包含列表的字典。


5. 列表创建

列表形式创建,可自定义索引,包括嵌套列表。


6. 元组创建

元组与列表类似,支持单层和嵌套。


7. 从Series创建

利用Series合并列创建DataFrame。


8. NumPy数组创建

利用NumPy函数生成、数组或随机数据。


9. from_dict 构建器

以字典结构输入数据,支持自定义行索引和列名。


10. from_records 构建器

处理结构化数据,如嵌套元组列表。


总结来说,DataFrame是pandas中以表格形式存储数据的关键工具,通过以上方法,你可以灵活地构造和导入数据进行分析。下一篇文章将聚焦于DataFrame数据的查询和筛选技巧。

温馨提示:答案为网友推荐,仅供参考
相似回答
大家正在搜