1)读取不同数据源的数据(meal_order_info.txt,meal_order_info.csv, meal_order_detail.xlsx),并存储位其他格式; 2)以上面读取的订餐数据为例,完成数据框的属性查询、增、删和修改等操作
时间: 2024-10-25 17:15:14 浏览: 61
1) 读取不同数据源的数据通常涉及到几个步骤:
- **文本文件(meal_order_info.txt)**: 可以使用`pandas.read_csv()`或`read_excel()`(如果内容是以逗号分隔的)读取,如果是纯文本文件,可以先转换成CSV再处理。示例:
```python
txt_df = pd.read_csv('meal_order_info.txt', delimiter='\t') # 如果是tab分隔
```
- **CSV文件(meal_order_info.csv)**: 使用`pd.read_csv()`直接读取:
```python
csv_df = pd.read_csv('meal_order_info.csv')
```
- **Excel文件(meal_order_detail.xlsx)**: 使用`pd.read_excel()`:
```python
excel_df = pd.read_excel('meal_order_detail.xlsx')
```
针对不同格式的数据,可能会使用`to_csv()`, `to_excel()`, 或者其他转换函数将数据保存到其他格式。例如,将数据框转换为JSON文件:
```python
json_df.to_json('new_data.json', orient='records')
```
2) 对于已经读取的订餐数据(假设为data_df),可以按照之前提到的方法进行操作:
- 属性查询:如查看某一列,`data_df['列名']`
- 增加:添加新列或行,比如`data_df['新列'] = 新值列表` 或 `data_df = data_df.append(new_row)`
- 删除:删除列 `data_df.drop('列名', axis=1)` 或删除行 `data_df = data_df.drop(index=行索引)`
- 修改:直接修改单个值 `data_df.at[index, '列名'] = 新值` 或批量替换 `data_df['列名'] = data_df['列名'].map(fcn_to_replace)`
阅读全文