第1个回答 2024-08-18
Python中pandas库实现数据缺失值判断
isnull()函数
在Python数据分析中,pandas库是处理数据集的重要工具之一,其中的isnull()函数用于判断数据集中是否存在缺失值。下面将详细阐述isnull()函数的用法及如何利用它判断数据缺失值。
● 选择题
以下语句输出的是dataframe中每列缺失值个数的是:
A df.isnull()
B df.isnull().count()
C df.isnull().sum()
D df.isnull().any()
正确答案为C。
● 问题解析
1. df.isnull():此函数返回一个由True和False构成的dataframe,用于判断dataframe是否存在缺失值。如附图1所示,若原数据为NaN,返回True,否则返回False。
2. df.isnull().count():此方法返回的是dataframe中每一列数据的个数,并不会对数据是否为缺失值进行判断。
3. df.isnull().sum():此方法用于统计dataframe中每一列缺失值的个数,返回值为由列名和本列缺失值的个数所组成的序列。
4. df.isnull().any():此方法用于判断dataframe中的每列是否有缺失值,若该列有缺失值,返回True,否则返回False。
5. 所以,正确答案是C。希望在选择题中判断每列缺失值个数的语句。
● 附图
图1 各种缺失值的判断形式
● 附图代码
import pandas as pd
from numpy import nan as NaN
df=pd.DataFrame([[1,2,NaN,4],[3,NaN,NaN,5],[4,3,NaN,NaN],
[3,NaN,7,2]],columns=['A','B','C','D'])
df
df.isnull()
df.isnull().count()
df.isnull().sum()
df.isnull().any()