第2关:在 jupyter notebook 中导入数据
时间: 2024-11-16 12:11:27 浏览: 70
在Jupyter Notebook中,导入数据通常涉及读取各种格式的数据文件,并将其转换为DataFrame等适合分析的结构。以下是常见的几种数据导入方式:
1. **CSV 文件**:
使用 `pandas` 库的 `read_csv()` 函数:
```
df = pd.read_csv('file_path.csv')
```
如果文件不在默认路径,可以提供完整路径。
2. **Excel 文件**:
```
df = pd.read_excel('file_path.xlsx')
```
或者使用 `openpyxl` 或 `xlrd` 库读取xlsx文件。
3. **JSON 文件**:
```
df = pd.read_json('file_path.json', orient='records')
```
4. **SQL 数据库**:
使用 `pandas.io.sql.read_sql_query` 或 `read_sql_table` 来从SQL查询结果获取数据:
```python
import sqlite3
conn = sqlite3.connect('db_file.db')
df = pd.read_sql_query("SELECT * FROM table_name", conn)
```
5. **CSV URL**:
可以直接从网络URL读取CSV:
```
df = pd.read_csv('http://example.com/data.csv')
```
6. **CSV.gz 或 .bz2 压缩文件**:
需要先解压缩再读取:
```
df = pd.read_csv('compressed_file.gz', compression='gzip')
```
记得替换上述代码中的 `'file_path'`, `'table_name'` 或 `'http://example.com/data.csv'` 为你实际的文件路径、表名或URL。
阅读全文