Pandas数据处理:缺失值处理示例

原创 谁践踏了优雅 2025-02-11 03:21 36阅读 0赞

在Python的pandas库中,处理缺失值是数据分析中的常见步骤。以下是一些处理缺失值的基本示例:

  1. 检查缺失值
    ```python
    import pandas as pd

创建一个包含缺失值的数据框

df = pd.DataFrame({‘A’: [1, 2], ‘B’: [3, np.nan]}, index=[‘row1’, ‘row2’]))

print(df)

  1. 输出结果:

A B
row1 1 3
row2 2 NaN

  1. 可以看到,列`B`出现了缺失值(NaN)。
  2. 2. **删除含有缺失值的行或列**:
  3. ```python
  4. # 删除含有缺失值的行
  5. df = df.dropna(subset=['B']])
  6. print(df)

输出结果:

  1. A B
  2. row1 1 3
  3. row2 2 NaN

现在B列已经没有了含有缺失值的行。

  1. 填充缺失值
    ```python

    使用中位数填充缺失值

    df[‘B’] = df[‘B’].fillna(df[‘B’].median())

print(df)

  1. 输出结果(假设`B`列有缺失值):

A B
row1 1 3.0
row2 2 NaN
`` 此时,列B`已经使用中位数填充了缺失值。

以上就是在pandas中处理缺失值的基本示例。根据实际数据和需求,你可能需要采用不同的方法来填补或删除缺失值。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,36人围观)

还没有评论,来说两句吧...

相关阅读