pandas统计分析 读取不同数据源的数据(meal_order_info.txt,meal_order_info.csv, meal_order_detail.xlsx),并存储位其他格式;
时间: 2024-10-25 19:16:30 浏览: 25
Pandas是Python中非常强大的数据分析库,它提供了丰富的数据结构DataFrame和Series,以及一组高效的数据处理工具,使得数据清洗、整理和分析变得非常方便。对于读取不同类型的数据源,Pandas有内置的函数可以轻松处理。
1. **读取文本文件(如meal_order_info.txt)**:你可以使用`pandas.read_csv()`如果文件是逗号分隔值(CSV),或者`pandas.read_excel()`如果文件是Excel格式。例如:
```python
import pandas as pd
# CSV文件
order_info = pd.read_csv('meal_order_info.txt', sep='\t') # 如果是tab键分隔
# Excel文件
order_info_excel = pd.read_excel('meal_order_info.xlsx')
```
2. **读取CSV文件(如meal_order_info.csv)**:直接使用`pd.read_csv()`即可:
```python
order_info_csv = pd.read_csv('meal_order_info.csv')
```
3. **读取Excel文件(如meal_order_detail.xlsx)**:
```python
order_detail = pd.read_excel('meal_order_detail.xlsx')
```
读取完毕后,你可以将它们转换成不同的格式,比如保存为CSV、Excel、JSON或其他格式,例如:
```python
order_info.to_csv('new_order_info.csv', index=False) # 保存为CSV
order_detail.to_excel('new_order_detail.xlsx', engine='openpyxl') # 使用openpyxl引擎保存为Excel
```
完成这些操作后,Pandas还支持对数据进行各种统计分析,如描述性统计、数据清洗、聚合、分组、合并等操作。
阅读全文