怎么用pandas读取文件
时间: 2024-10-17 20:13:17 浏览: 32
在Python中,使用pandas库读取文件非常方便,pandas提供了多种方法来导入各种格式的数据,包括CSV、Excel、SQL数据库等。下面是一些常见文件类型读取的例子:
1. **CSV文件**(逗号分隔值文件):
```python
import pandas as pd
data = pd.read_csv('file.csv')
```
2. **Excel文件**(例如.xlsx或.xls):
```python
data = pd.read_excel('file.xlsx')
# 或者使用特定引擎读取xls文件,如:
data = pd.read_excel('file.xls', engine='xlrd')
```
3. **SQL数据库**:
```python
import sqlite3
conn = sqlite3.connect('database.db')
query = "SELECT * FROM table_name"
data = pd.read_sql_query(query, conn)
conn.close()
```
4. **JSON文件**:
```python
data = pd.read_json('file.json')
```
5. **XML文件**:
```python
data = pd.read_xml('file.xml')
```
6. **HTML网页表单**:
```python
data = pd.read_html('http://example.com/table.html', header=0) # 如果有多张表格,header参数指定哪一行作为列名
```
7. **二进制文件**(比如HDF5或Pickle):
```python
data = pd.read_hdf('file.h5', key='your_dataset_key')
```
每次读取后,`data`就是DataFrame对象,你可以直接查看数据或者进行后续的数据清洗和分析操作。
阅读全文