【基础】Pandas:数据读写操作(CSV, Excel, SQL)
发布时间: 2024-06-26 12:05:13 阅读量: 4 订阅数: 18
![【基础】Pandas:数据读写操作(CSV, Excel, SQL)](https://img-blog.csdnimg.cn/20190130144438802.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5NTgyOTYw,size_16,color_FFFFFF,t_70)
# 1. **2.1 CSV 文件读取**
CSV(逗号分隔值)文件是一种常见的文本文件格式,用于存储表格数据。Pandas 提供了 `read_csv()` 函数来读取 CSV 文件。
```python
import pandas as pd
# 读取 CSV 文件
df = pd.read_csv('data.csv')
```
**2.1.1 read_csv() 函数**
`read_csv()` 函数具有以下参数:
- `filepath_or_buffer`: CSV 文件的路径或文件对象。
- `sep`: 分隔符,默认为逗号。
- `header`: 指定是否将第一行作为标题行。
- `index_col`: 指定要作为索引的列。
- `skiprows`: 跳过指定行数。
- `nrows`: 读取指定行数。
- `encoding`: 文件编码。
- `dtype`: 指定列的数据类型。
# 2. 数据读取
### 2.1 CSV 文件读取
#### 2.1.1 read_csv() 函数
`read_csv()` 函数用于从 CSV 文件中读取数据并将其转换为 Pandas DataFrame。其语法如下:
```python
read_csv(filepath_or_buffer, sep=',', header='infer', index_col=None, dtype=None, engine=None, **kwargs)
```
#### 2.1.2 参数详解
| 参数 | 描述 | 默认值 |
|---|---|---|
| `filepath_or_buffer` | CSV 文件的路径或文件对象 | 无 |
| `sep` | 分隔符,用于分隔每一行中的字段 | ',' |
| `header` | 指定是否将第一行作为列名,可以是整数或字符串 | 'infer' |
| `index_col` | 指定将哪一列作为索引,可以是整数或字符串 | None |
| `dtype` | 指定每列的数据类型,可以是字典或字符串 | None |
| `engine` | 指定用于解析 CSV 文件的引擎,可以是 'python' 或 'c' | None |
**代码示例:**
```python
import pandas as pd
# 从 CSV 文件读取数据
df = pd.read_csv('data.csv')
# 指定分隔符和列名
df = pd.read_csv('data.csv', sep=';', header=0)
# 将第一列作为索引
df = pd.read_csv('data.csv', index_col=0)
```
### 2.2 Excel 文件读取
#### 2.2.1 read_excel() 函数
`read_excel()` 函数用于从 Excel 文件中读取数据并将其转换为 Pandas DataFrame。其语法如下:
```python
read_excel(io, sheet_name=0, header=0, index_col=None, usecols=None, **kwargs)
```
#### 2.2.2 参数详解
| 参数 | 描述 | 默认值 |
|---|---|---|
| `io` | Excel 文件的路径或文件对象 | 无 |
| `sheet_name` | 指定要读取的工作表,可以是整数或字符串 | 0 |
| `header` | 指定是否将第一行作为列名,可以是整数或字符串 | 0 |
| `index_col` | 指定将哪一列作为索引,可以是整数或字符串 | None |
| `usecols` | 指定要读取的列,可以是整数列表或字符串列表 | None |
**代码示例:**
```python
import pandas as pd
# 从 Excel 文件读取数据
df = pd.read_excel('data.xlsx')
# 指定工作表和列名
df = pd.read_excel('data.xlsx', sheet_name='Sheet1', header=1)
# 将第一列作为索引并指定要读取的列
df = pd.read_excel('data.xlsx', index_col=0, usecols=[0, 1, 2])
```
### 2.3 SQL 数据库读取
#### 2.3.1 read_sql() 函数
`read_sql()` 函数用于从 SQL 数据库中读取数据并将其转换为 Pandas DataFrame。其语法如下:
```python
read_sql(sql, con, index_col=None, coerce_float=True, params=None, parse_dates=None, columns=
```
0
0