Python数据科学实践:Pandas操作案例

原创 矫情吗;* 2025-02-11 09:45 42阅读 0赞

Pandas是Python中一个强大的数据处理库,它提供了丰富的数据结构和数据分析工具。下面我将通过几个实例来展示Pandas的操作。

  1. 导入Pandas并创建DataFrame
  1. import pandas as pd
  2. # 创建一个简单的 DataFrame
  3. data = {'Name': ['Alice', 'Bob', 'Charlie'],
  4. 'Age': [25, 30, 35],
  5. 'City': ['New York', 'London', 'Sydney']}
  6. df = pd.DataFrame(data)
  7. print(df)
  1. 数据清洗和处理
  • 删除重复数据
    1. df.drop_duplicates(inplace=True)
    2. print(df)
  • 缺失值处理(填充、删除等)
    ```python

    使用中位数填充缺失值

    median_filled = df[‘Age’].fillna(df[‘Age’].median())
    print(median_filled)

使用dropna方法删除包含缺失值的行

cleaned_data = df.dropna(subset=[‘Age’]])
print(cleaned_data)

  1. 3. 数据分组和汇总
  2. - 按列分组
  3. ```python
  4. grouped_by_city = df.groupby('City')
  5. citywise_data = grouped_by_city['Age'].sum()
  6. print(citywise_data)
  • 对数值进行四舍五入
    1. rounded_age = df['Age'].round(0) # 将年龄数据四舍五入到个位数
    2. print(rounded_age)

以上就是Pandas操作的一些基本案例,实际使用中可能需要处理更复杂的数据和场景。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,42人围观)

还没有评论,来说两句吧...

相关阅读