Python数据分析:pandas库的基础操作与应用实例

原创 短命女 2025-03-14 13:45 25阅读 0赞

Pandas是Python中最常用的数据分析库。它提供了一种高效、灵活的方式来处理和分析数据。以下是一些基本的操作以及应用实例:

  1. 安装和导入

    1. # 安装 pandas
    2. !pip install pandas
    3. # 导入 pandas
    4. import pandas as pd
  2. 创建数据框

    1. # 创建一个简单的数据框
    2. data = {'Name': ['Alice', 'Bob', 'Charlie'],
    3. 'Age': [25, 30, 35]},
    4. index=['ID1', 'ID2', 'ID3']]
    5. df = pd.DataFrame(data)
  3. 查看数据

    1. print(df.head()) # 查看前五行
    2. print(df.tail(3))) # 查看后三行
  4. 选择列或特定行

    1. column_name = 'Name'
    2. selected_column = df[column_name]]
    3. row_index = 'ID2'
    4. selected_row = df.loc[row_index]
  5. 数据操作

    • 添加新列
      1. df['Email'] = df.apply(lambda row: row['Name'] + '@example.com', axis=1)
    • 合并或拼接数据框

      1. # 平行堆叠数据框
      2. merged_df = pd.concat([df, df2]], ignore_index=True)
      3. # 水平拼接(根据某个列的值进行分组)数据框
      4. grouped_df = df.groupby('Category').sum()
  6. 数据清洗和预处理

    • 删除重复行或特定行

      1. # 删除重复行
      2. df.drop_duplicates(inplace=True)
      3. # 删除特定行(根据条件)
      4. condition = df['Age'] > 30
      5. df = df[condition]

以上就是Pandas库的基础操作与应用实例。在实际的数据分析项目中,这些操作将更加复杂和灵活。

文章版权声明:注明蒲公英云原创文章,转载或复制请以超链接形式并注明出处。

发表评论

表情:
评论列表 (有 0 条评论,25人围观)

还没有评论,来说两句吧...

相关阅读