pandas生成dataframe
时间: 2024-01-31 22:11:08 浏览: 121
以下是两种使用pandas生成DataFrame的方法:
1. 使用列表创建DataFrame:
```python
import numpy as np
import pandas as pd
nums = np.array([i for i in range(1,31)]).reshape(10,3)
colu = [f'col_{i}' for i in range(3)]
inde = [f'row_{i}' for i in range(10)]
df = pd.DataFrame(data=nums, index=inde, columns=colu)
```
2. 使用字典创建DataFrame:
```python
import numpy as np
import pandas as pd
hight = np.random.randint(158,180,10)
weight = np.random.randint(49,75,10)
df = pd.DataFrame(data={'hight':hight, 'weight':weight})
```
相关问题
pandas生成dataframe速度慢
生成 Pandas DataFrame 的速度慢通常是由于以下原因之一导致的:
1. 数据量太大:如果您尝试使用大量数据生成 DataFrame,那么生成时间可能会很长。您可以尝试使用更小的数据集或者使用其他的方法,如使用 Pandas 的 read_csv 函数从文件中读取数据。
2. 不合理的数据结构:如果您的数据结构不合理,那么生成 DataFrame 可能会很慢。例如,如果您使用嵌套列表生成 DataFrame,那么它会比使用字典或 NumPy 数组生成 DataFrame 更慢。
3. 内存不足:如果您的计算机内存不足,那么生成 DataFrame 可能会很慢。您可以尝试使用更大的计算机或者使用其他的方法来减少内存使用量,如使用 chunksize 参数读取大型数据集。
4. 使用循环:如果您使用循环生成 DataFrame,那么生成时间可能会很长。相反,您可以尝试使用 Pandas 的向量操作,如 apply 和 map,来加速生成过程。
5. 使用不必要的功能:如果您使用不必要的功能,如排序或重复数据,那么生成 DataFrame 可能会很慢。您可以尝试避免这些不必要的功能来提高生成速度。
pandas如何生成dataframe
使用Pandas库的DataFrame()函数可以生成数据帧(DataFrame)。DataFrame()函数可以接受多种类型的输入数据,包括列表、字典、数组等。以下是几个示例:
1. 从列表生成DataFrame:
```python
import pandas as pd
data = [['Alex', 10], ['Bob', 12], ['Clarke', 13]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
print(df)
```
输出结果为:
```
Name Age
0 Alex 10
1 Bob 12
2 Clarke 13
```
2. 从字典生成DataFrame:
```python
import pandas as pd
data = {'Name': ['Alex', 'Bob', 'Clarke'], 'Age': [10, 12, 13]}
df = pd.DataFrame(data)
print(df)
```
输出结果为:
```
Name Age
0 Alex 10
1 Bob 12
2 Clarke 13
```
3. 从数组生成DataFrame:
```python
import pandas as pd
import numpy as np
data = np.array([['Alex', 10], ['Bob', 12], ['Clarke', 13]])
df = pd.DataFrame(data, columns=['Name', 'Age'])
print(df)
```
输出结果与第一个示例相同:
```
Name Age
0 Alex 10
1 Bob 12
2 Clarke 13
```
阅读全文