Python数据处理:pandas库缺失值处理案例

原创 冷不防 2025-02-06 17:00 61阅读 0赞

在Python的数据处理中,Pandas库是常用的一种工具,它内置了处理缺失值的功能。下面我们将通过几个案例来演示如何使用Pandas进行缺失值处理。

  1. 创建带有缺失值的DataFrame
  1. import pandas as pd
  2. # 创建一个包含缺失值的DataFrame
  3. data = {'Name': ['Alice', 'Bob', 'Charlie'],
  4. 'Age': [25, None, 30],
  5. 'City': ['New York', 'Los Angeles', None]}
  6. df = pd.DataFrame(data)
  7. print(df)

输出结果:

  1. Name Age City
  2. 0 Alice 25 New York
  3. 1 Bob NaN Los Angeles
  4. 2 Charlie 30 NaN
  1. 使用dropna()方法删除带有缺失值的行
  1. # 删除Age列含有缺失值的行
  2. df_clean = df.dropna(subset=['Age']])
  3. print(df_clean)

输出结果:

  1. Name Age City
  2. 0 Alice 25 New York
  3. 1 Charlie 30 NaN

通过以上两个案例,你可以看到如何使用Pandas的dropna()方法来处理缺失值。根据实际情况,还可以选择其他如fillna()、replace()等方法来处理缺失数据。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,61人围观)

还没有评论,来说两句吧...

相关阅读