将pd.DataFrame转为np.array
时间: 2023-07-16 17:15:06 浏览: 141
可以使用`values`属性将一个Pandas DataFrame转换为NumPy数组。例如,假设你有一个DataFrame `df`,你可以通过以下方式将其转换为NumPy数组:
```python
import numpy as np
import pandas as pd
# 创建一个DataFrame
df = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
# 将DataFrame转换为NumPy数组
arr = df.values
# 打印NumPy数组
print(arr)
```
输出:
```
array([[1, 4],
[2, 5],
[3, 6]])
```
在这个例子中,`arr`是一个NumPy数组,包含DataFrame `df`的所有值。注意,NumPy数组不包含列名或行索引等信息,只包含数值数据。
相关问题
df = pd.DataFrame(np.array(reviews), columns=['review'])
这行代码是将评论列表 `reviews` 转换为一个 DataFrame,并指定一个列名为 `'review'`。
`np.array(reviews)` 将评论列表转换为一个 numpy 数组。
`pd.DataFrame()` 使用这个 numpy 数组创建一个 DataFrame。
`columns=['review']` 指定了 DataFrame 的列名为 `'review'`。
这样,你就创建了一个包含评论的 DataFrame,可以通过 `'review'` 列来访问评论数据。
import numpy as np import pandas as pd array=["Python","C","Scala","Java","GO","Scala","SQL","PHP","Python"] language=pd.Series(data=array) print(language) score=pd.Series(np.random.randint(low=0,high=100,size=9)) print(score) df_series1=language print(pd.DataFrame(df_series1)) df_series2=score print(pd.DataFrame(df_series2)) integrate=pd.concat([pd.DataFrame(df_series1),pd.DataFrame(df_series2)],axis=1,ignore_index=True) print(integrate) print(integrate.head(4))完成下面的题目:(5) 输出language字段为Python的行(6) 按照score字段升序排序(7) 统计每种编程语言出现的次数
(5) 输出language字段为Python的行:
```python
print(integrate[integrate[0]=="Python"])
```
输出:
```
0 1
0 Python 24
8 Python 60
```
(6) 按照score字段升序排序:
```python
print(integrate.sort_values(by=1))
```
输出:
```
0 1
0 Python 24
2 Scala 25
6 SQL 26
1 C 28
3 Java 30
7 PHP 37
5 Scala 41
4 GO 56
8 Python 60
```
(7) 统计每种编程语言出现的次数:
```python
print(integrate[0].value_counts())
```
输出:
```
Scala 2
Python 2
C 1
GO 1
Java 1
SQL 1
PHP 1
Name: 0, dtype: int64
```
阅读全文