如何创建一个DataFrame?
时间: 2024-01-07 15:20:26 浏览: 84
在Python pandas中,可以通过多种方式创建一个DataFrame,包括从关系型数据库、csv文件、Parquet/ORC等方式。以下是其中的一些方法:
1. 从字典创建DataFrame:可以通过一个字典来创建DataFrame,其中字典的key为列名,value为列的值。例如:
```python
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35]}
df = pd.DataFrame(data)
```
2. 从列表创建DataFrame:可以通过一个列表来创建DataFrame,其中列表的每个元素为一个元组,元组中的每个元素为一列的值。例如:
```python
import pandas as pd
data = [('Alice', 25), ('Bob', 30), ('Charlie', 35)]
df = pd.DataFrame(data, columns=['name', 'age'])
```
3. 从csv文件创建DataFrame:可以通过pandas的read_csv函数来读取csv文件并创建DataFrame。例如:
```python
import pandas as pd
df = pd.read_csv('data.csv')
```
4. 从关系型数据库创建DataFrame:可以通过pandas的read_sql函数来读取关系型数据库中的数据并创建DataFrame。例如:
```python
import pandas as pd
import sqlite3
conn = sqlite3.connect('example.db')
df = pd.read_sql('SELECT * FROM table_name', conn)
```
5. 从Parquet/ORC创建DataFrame:可以通过pandas的read_parquet或read_orc函数来读取Parquet/ORC文件并创建DataFrame。例如:
```python
import pandas as pd
df = pd.read_parquet('data.parquet')
```
以上是创建DataFrame的一些方法,创建后可以通过df['new_column'] = value的方式来添加新列。
阅读全文