1)读取该文件中前50名的大学的 #排名、学校名称、省市、总分、学科水平、师资规模、人才培养、科学研究、高端人才、重大项目、国际竞争力的数据, #保存成一个命名为df的DataFrame,并且将排名设为行索引。(20分) #(2)查看df中总分、人才培养、高端人才这三列的描述性统计信息。(9分(3)根据df中的数据,找出在“师资规模”这项指标上排名前10的大学, #要求生成一个命名的rank10的新DataFrame,内容包括排序、学校名称、师资规模,且将排序设为行索引
时间: 2023-07-10 15:31:22 浏览: 119
matlab 中如何读取文本文件.pdf
(1) 读取文件并创建 DataFrame:
假设文件名为 `university.csv`,可以使用 pandas 库的 `read_csv()` 函数读取该文件,并使用 `set_index()` 方法将排名设置为行索引:
```python
import pandas as pd
df = pd.read_csv('university.csv', usecols=[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10], nrows=50)
df = df.set_index('排名')
```
其中,`usecols` 参数指定要读取的列,`nrows` 参数指定要读取的行数,`set_index()` 方法将索引列设置为排名列。
(2) 查看描述性统计信息:
可以使用 `describe()` 方法查看总分、人才培养、高端人才这三列的描述性统计信息:
```python
df[['总分', '人才培养', '高端人才']].describe()
```
(3) 找出在“师资规模”这项指标上排名前10的大学:
可以使用 `sort_values()` 方法对 DataFrame 进行排序,并使用 `head()` 方法取前 10 行,最后将排序列设置为行索引:
```python
rank10 = df[['学校名称', '师资规模']].sort_values(by='师资规模', ascending=False).head(10)
rank10 = rank10.reset_index().set_index('排序')
```
其中,`sort_values()` 方法的参数 `by` 指定要排序的列,`ascending=False` 表示降序排序。`reset_index()` 方法用于重置索引,`set_index()` 方法将排序列设置为行索引。
阅读全文