Pandas常用数据分析代码整理
017pandas常用代码
Pandas常用数据分析代码整理
一、数据读取与导出
1. 数据读取
1 | import pandas as pd |
2. 数据导出
1 | # 导出为CSV文件 |
二、数据查看与探查
1 | # 查看DataFrame前5行 |
三、数据选择与筛选
1. 按列选择
1 | # 选择单列(返回Series) |
2. 按行选择
1 | # 按位置选择单行 |
3. 同时选择行和列
1 | # 按位置选择 |
四、数据清洗
1. 缺失值处理
1 | # 检查缺失值 |
2. 重复值处理
1 | # 检查重复行 |
3. 数据类型转换
1 | # 转换为整数类型 |
4. 列名与索引操作
1 | # 重命名列名 |
五、数据转换与处理
1. 数据排序
1 | # 按列值升序排序 |
2. 数据分组与聚合
1 | # 按单列分组并计算均值 |
3. 数据合并与连接
1 | # 垂直拼接DataFrame |
4. 数据重塑
1 | # 宽格式转长格式 |
六、数据分析与统计
1 | # 计算基本统计量 |
七、数据可视化
1 | import matplotlib.pyplot as plt |
八、常用函数速查表
| 功能类别 | 常用函数 |
|---|---|
| 数据读取 | pd.read_csv(), pd.read_excel(), pd.read_sql() |
| 数据导出 | df.to_csv(), df.to_excel(), df.to_sql() |
| 数据查看 | df.head(), df.tail(), df.info(), df.describe() |
| 数据选择 | df.loc[], df.iloc[], df[条件] |
| 缺失值处理 | df.dropna(), df.fillna(), df.interpolate() |
| 数据分组 | df.groupby(), df.agg(), pivot_table() |
| 数据合并 | pd.concat(), pd.merge(), df.join() |
| 数据转换 | pd.melt(), df.pivot(), df.replace() |
| 统计分析 | df.mean(), df.sum(), df.corr(), df.count() |
| 可视化 | df.plot(), df.plot.bar(), df.plot.scatter() |
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Nosaw博客!
评论




