pandas项目实战
时间: 2023-10-06 09:07:17 浏览: 135
pandas实战运用
在pandas项目实战中,可以使用多个pandas提供的方法来对数据进行操作和分析。
其中,assign方法可以直接向数据集中添加新的列。例如,我们可以通过df.assign(score=np.random.randint(0,100,size=5))的方式来给数据集df添加一个名为"score"的列,该列的值是随机生成的0到100之间的整数。
另外,可以使用pandas_profiling模块来生成数据分析的报告。通过安装并调用pandas_profiling模块,可以使用以下几行代码来生成报告:
```
# 安装pandas_profiling模块
%pip install pandas-profiling
import pandas_profiling
df = pd.read_csv("data.csv")
profile = df.profile_report(title="Pandas Profiling Report")
profile.to_file(output_file="output.html")
```
通过这个报告,可以了解数据集的概览、缺失值、重复值等情况,以及各个变量的统计摘要、频数分布等信息。
此外,还可以使用query方法对数据进行过滤。通过输入筛选条件,例如df.query("note > 90"),可以从数据集df中筛选出"note"列中大于90的数据。
通过使用这些pandas的方法和技巧,可以更好地进行数据操作、分析和筛选,从而实现pandas项目的实战。<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *3* [20 个 Pandas 数据实战案例,干货多多](https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/123267040)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"]
- *2* [分享30个超级好用的Pandas实战技巧](https://blog.csdn.net/weixin_40787712/article/details/124580712)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
阅读全文