jupyter notebook读取数据的所有公式
时间: 2024-11-09 12:12:57 浏览: 12
Jupyter Notebook是一个交互式的计算环境,其中包含了Python的数据处理库Pandas,它提供了丰富的功能来读取各种格式的数据。以下是使用Pandas在Jupyter Notebook中读取数据的一些常见公式:
1. **读取CSV文件**:
```python
import pandas as pd
data = pd.read_csv('file.csv') # 如果文件在同一目录下
or
data = pd.read_csv('/path/to/file.csv')
```
2. **读取Excel文件**:
```python
data = pd.read_excel('file.xlsx')
```
3. **读取SQL数据库** (使用`pandas_sql`包):
```python
from sqlalchemy import create_engine
engine = create_engine('sqlite:///my_database.db')
data = pd.read_sql_query("SELECT * FROM table_name", engine)
```
4. **读取JSON文件**:
```python
data = pd.read_json('file.json', orient='records')
```
5. **读取HTML网页数据** (如果页面有表格结构):
```python
df = pd.read_html('http://example.com/table.html', header=0)
```
6. **读取XML文件**:
```python
data = pd.read_xml('file.xml', xpath='/root/node')
```
以上都是基本的读取操作,实际使用可能会涉及更复杂的参数设置,例如指定分隔符、编码、缺失值处理等。在每个步骤之后,`data`变量通常会存储一个DataFrame对象,这是Pandas用于数据操作的基本数据结构。
阅读全文