将下列 JSON 格式数据复制到 Linux 系统中,并保存命名为 employee.json。 { "id":1, "name":"Ella", "age":36 } { "id":2, "name":"Bob", "age":29 } { "id":3, "name":"Jack", "age":29 } { "id":4, "name":"Jim", "age":28 } { "id":4, "name":"Jim", "age":28 } { "id":5, "name":"Damon" } { "id":5, "name":"Damon" } 为 employee.json 创建 DataFrame,并写出 Python 语句完成下列操作: (1)查询所有数据; (2)查询所有数据,并去除重复的数据; (3)查询所有数据,打印时去除 id 字段; (4)筛选出 age>30 的记录; (5)将数据按 age 分组; (6)将数据按 name 升序排列; (7)取出前 3 行数据; (8)查询所有记录的 name 列,并为其取别名为 username; (9)查询年龄 age 的平均值; (10)查询年龄 age 的最小值。
时间: 2023-07-03 09:28:13 浏览: 506
Json数据格式的使用方法入门教程.pdf
5星 · 资源好评率100%
可以使用以下 Python 代码来完成这些任务:
```python
import pandas as pd
# 读取 JSON 文件并创建 DataFrame
df = pd.read_json('employee.json', lines=True)
# (1)查询所有数据
print(df)
# (2)查询所有数据,并去除重复的数据
print(df.drop_duplicates())
# (3)查询所有数据,打印时去除 id 字段
print(df.drop('id', axis=1))
# (4)筛选出 age>30 的记录
print(df[df['age'] > 30])
# (5)将数据按 age 分组
print(df.groupby('age').size())
# (6)将数据按 name 升序排列
print(df.sort_values('name'))
# (7)取出前 3 行数据
print(df.head(3))
# (8)查询所有记录的 name 列,并为其取别名为 username
print(df['name'].rename('username'))
# (9)查询年龄 age 的平均值
print(df['age'].mean())
# (10)查询年龄 age 的最小值
print(df['age'].min())
```
注意,这些操作中的结果可能因为数据中的实际情况而有所不同。
阅读全文