Jupyter Notebook 显性查询
时间: 2023-12-26 13:04:44 浏览: 68
在 Jupyter Notebook 中,可以使用 Python 的 `pandas` 库来进行显性查询。首先需要读取数据集,将数据集存储为 `DataFrame` 对象。然后,使用 `DataFrame` 对象的 `query` 和 `sort_values` 方法来进行查询和排序。
下面是一个示例代码,假设我们有一个 `employees` 数据集,其中包含员工的姓名、薪水和部门信息:
```python
import pandas as pd
# 读取 employees 数据集
employees = pd.read_csv('employees.csv')
# 显示前 10 行数据
employees.head(10)
```
接下来,我们可以使用 `query` 方法来进行查询。例如,查询薪水大于 5000 的员工:
```python
# 查询薪水大于 5000 的员工
result = employees.query('salary > 5000')
result
```
如果需要查询多个条件,可以使用 `&` 和 `|` 连接多个条件:
```python
# 查询薪水大于 5000 并且部门是 IT 的员工
result = employees.query('salary > 5000 & department == "IT"')
result
```
最后,我们可以使用 `sort_values` 方法对查询结果进行排序。例如,按照薪水从高到低的顺序对查询结果进行排序:
```python
# 按照薪水从高到低排序
result = result.sort_values(by='salary', ascending=False)
result
```
执行上述代码后,将返回符合条件的员工记录,并按照薪水从高到低的顺序排列。
阅读全文