要成为 Pandas 专家,需要掌握以下 29 个最常用的 Pandas 函数:
数据读取:
pd.read_csv:读取 csv 文件。pd.read_excel:读取 Excel 文件。
数据写入:
df.to_csv:将 DataFrame 写入 csv 文件。df.to_excel:将 DataFrame 写入 Excel 文件。
数据帧创建与属性查询:
pd.DataFrame:创建数据帧。df.shape:查看数据帧的维度。
数据查看:
数据类型查询:
数据类型转换:
描述性信息分析:
df.info:获取数据帧的概览信息。df.describe:获取数据的统计描述,包括平均值、标准偏差等。
缺失值处理:
数据合并:
数据排序:
数据分组与聚合:
df.groupby:对数据进行分组并执行聚合操作。
列操作:
df.rename:重命名数据帧的列。df.drop:删除数据帧的列。
增加和删除列:
赋值运算符、df.assign:增加列。df.drop:删除列。
数据过滤:
df.loc:基于标签进行过滤。df.iloc:基于索引位置进行过滤。
数据去重:
df.drop_duplicates:去除重复行。
值分布查找:
df.value_counts:获取列中每个唯一值的频率。
索引操作:
df.reset_index:重置数据帧的索引并删除旧索引。
透视表:
pd.pivot_table:创建透视表,以行列交叉的方式展示数据。
通过掌握这些基础函数,你将能够高效地进行数据清洗、分析和可视化操作,从而在 Pandas 数据处理领域达到专家水平。