json_normalize 筛选输出列
时间: 2024-11-19 18:12:04 浏览: 18
`json_normalize` 是 pandas 库中的一个函数,用于将 JSON 格式的数据规范化成表格形式,通常是从字典列表中提取嵌套的数据结构。当你想要筛选输出列时,你可以传递一个 `columns` 参数给 `json_normalize`,这个参数是一个列表,包含你想要在结果中保留的列名。
例如,如果你有一个 JSON 对象,其中包含一些嵌套的对象或数组,你想只提取特定字段,如:
```python
import pandas as pd
data = [
{
"id": 1,
"info": {
"name": "John",
"age": 30,
"scores": [85, 90, 95]
}
},
{
"id": 2,
"info": {
"name": "Jane",
"age": 28,
"scores": [75, 80]
}
}
]
normalized_data = pd.json_normalize(data, record_path=['info'], columns=['name', 'age'])
# 输出:
# id name age
# 0 1 John 30
# 1 2 Jane 28
```
在这个例子中,`record_path=['info']` 指定了从原始 JSON 数据结构中沿着 "info" 字段向下查找,而 `columns=['name', 'age']` 则指定了我们要把 "name" 和 "age" 的值作为单独的列提取出来。
阅读全文