Python数据处理:Pandas缺失值处理案例

原创 ╰半夏微凉° 2025-01-14 23:45 57阅读 0赞

在Python的数据处理库Pandas中,处理缺失值是常用且重要的步骤。以下是一些Pandas处理缺失值的案例:

  1. 检查缺失值

    1. import pandas as pd
    2. data = {'Name': ['John', 'Alice', None],
    3. 'Age': [25, 30, None],
    4. 'City': ['New York', 'London', None]}}
    5. df = pd.DataFrame(data)
    6. print("Missing values in the dataframe:")
    7. print(df.isnull().sum())

    这会显示每列的缺失值数量。

  2. 删除含有缺失值的行/列

    1. # 删除含有任何缺失值的行
    2. df = df.dropna(how='any')
    3. # 或者,删除含有特定缺失值的列
    4. columns_with_nulls = df.columns[df.isnull().any()])
    5. if len(columns_with_nulls) > 0:
    6. df = df.drop(columns=columns_with_nulls)
    7. print("The cleaned dataframe is:")
    8. print(df)

    这将删除所有行或列,如果它们至少含有一个缺失值。

  3. 填充缺失值

    1. # 使用平均值填充数值类型列的缺失值
    2. df['Age'] = df['Age'].fillna(value=df['Age'].mean())
    3. # 对于非数值类型列,可以使用mode、first/last等方法
    4. df['City'] = df['City'].fillna(value='London')
    5. print("The dataframe with filled missing values is:")
    6. print(df)

    这里填充了’Age’列的缺失值为平均值。

通过以上案例,你可以了解到在处理Pandas数据时,如何有效地管理和处理缺失值。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,57人围观)

还没有评论,来说两句吧...

相关阅读