使用Pandas处理CSV数据时的问题：缺失值处理-向日葵屋

使用Pandas处理CSV数据时的问题：缺失值处理

原创迷南。 2025-02-25 07:03 31阅读 0赞

在Pandas处理CSV数据时，处理缺失值是常见的任务。以下是一些处理缺失值的方法：

检查缺失值：
使用isnull()或notnull()函数来检查数据框中是否存在缺失值。

import pandas as pd
df = pd.DataFrame({'A': [1, 2, None], 'B': [4, None, 5]})
print(df.isnull())

删除含有缺失值的行或列：
使用dropna()函数，可以选择删除含有任何缺失值的行。

df = df.dropna()  # 删除包含任何缺失值的行
# 如果你想保留最后没有缺失值的行，可以设置 'how' 参数为 'last'

填充缺失值：
Pandas提供了多种方法来填充缺失值，例如：

使用fillna(value)函数，可以给指定的值赋值。

df = df.fillna(0)  # 将所有缺失值替换为0

对于类别特征，可以使用mode()或fillna(method='ffill'))来填充。

category_col = 'A'  # 假设'A'列是类别列
# 使用mode函数找到最常见的值填充
df[category_col] = df[category_col].fillna(df[category_col]].mode()[0])
# 或者使用ffill方法向前填充
df[category_col] = df[category_col].fillna(method='ffill'))