Python数据处理问题:如何使用Pandas进行缺失值填充?

原创 我不是女神ヾ 2025-02-24 04:06 34阅读 0赞

在Pandas中,处理缺失值通常有以下几种方法:

  1. dropna(删除含有缺失值的行或列):

    1. df = pd.DataFrame({
    2. 'A': [1, 2, np.nan], # 缺失值
    3. 'B': ['foo', 'bar', 'baz'], # 不同数据
    4. 'C': [5.0, 6.0, 7.0], # 有序数据
    5. })
    6. df = df.dropna() # 删除含有NaN的行
  2. fillna(用指定值填充缺失值):

    1. df = df.fillna(value=0) # 用0替换NaN
  3. mean/median/mode(计算列的平均值、中位数或众数,并用该值填充缺失值):

    1. mean_value = df['A'].mean() # 计算'A'列的平均值
    2. df = df.fillna(value=mean_value) # 用平均值替换NaN

根据实际需求,选择合适的方法进行处理。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,34人围观)

还没有评论,来说两句吧...

相关阅读