1. 将下列 JSON 格式数据复制到 Linux 系统中,并保存命名为 employee.json。 [ "id":l , "name":" Ella", "age":36 ){ "id":2, name" :"Bob","age":29 }( "id":3 , "name":"Jack","age":29 }{ "id":4 , "name":"Jim","age":28 }! "id":4 , "name":"Jim","age":28 )[ "id":5 , "name":"Damon"}( "id":5 , "name" Damon" } 为employee.json 创建 DataFrame,并写出Python语句完成下列操作:(1)查询所有数据,并去除重复的数据;(2)将数据按 age分组; (3)将数据按name升序排列; (4)查询所有记录的name列,并为其取别名为username;(5)查询年龄age的平均值;
时间: 2023-07-07 11:44:02 浏览: 385
以下是 Python 代码实现:
```python
import pandas as pd
# 读取 JSON 文件并创建 DataFrame
df = pd.read_json('employee.json', lines=True)
# 查询所有数据,并去除重复的数据
df = df.drop_duplicates()
# 将数据按 age 分组
grouped = df.groupby('age')
# 将数据按 name 升序排列
df = df.sort_values('name')
# 查询所有记录的 name 列,并为其取别名为 username
df_username = df['name'].rename('username')
# 查询年龄 age 的平均值
mean_age = df['age'].mean()
```
注意,这里的 JSON 格式数据有些问题,需要进行一些修正。修正后的 employee.json 文件内容如下:
```json
[
{"id": 1, "name": "Ella", "age": 36},
{"id": 2, "name": "Bob", "age": 29},
{"id": 3, "name": "Jack", "age": 29},
{"id": 4, "name": "Jim", "age": 28},
{"id": 5, "name": "Damon", "age": null},
{"id": 5, "name": "Damon", "age": null}
]
```