一行代码优化：将嵌套JSON转为 pandas DataFrame

需积分: 5 1 下载量 117 浏览量更新于2024-08-05 收藏 686B TXT 举报

在提供的Python脚本中，核心功能是将JSON数据转换为Pandas DataFrame。原代码中使用`pd.DataFrame.from_dict(dc['data'])`来处理嵌套的JSON数据，但为了优化并减少冗余列（即扁平化多层嵌套结构），引入了`pd.json_normalize()`函数。`json_normalize`是Pandas提供的一种实用工具，它能根据指定的键路径或列名将嵌套的JSON数据结构展开，使得数据更容易进行分析和操作。在`json_to_table_nested`函数中，首先打开指定的JSON文件，如`F:\AA\API-BotStatus-複製.txt`，并使用`json.load()`方法读取其中的数据，存储在变量`dc`中。然后，通过将`dc['data']`作为参数传递给`pd.json_normalize()`，这行关键代码实现了对嵌套数据的规范化处理。这个操作会生成一个DataFrame，其中的数据结构更简洁，减少了因为原始JSON的多层嵌套导致的列重复。原始代码可能需要处理的数据结构类似于： ```json { "data": { "key1": [ {"sub_key1": "value1", "sub_key2": "value2"}, {"sub_key1": "value3", "sub_key2": "value4"} ], "key2": {...}, ... } } ``` 经过`pd.json_normalize()`处理后，结果DataFrame可能类似这样： ``` sub_key1 sub_key2 0 value1 value2 1 value3 value4 ``` 这样做的好处在于，每个子键及其对应的值都被转换成了DataFrame中的单独列，便于后续的数据清洗、分析和可视化。最后，将处理后的DataFrame保存为Excel文件（`.xlsx`格式），方便其他用户查看和使用。这段脚本的核心改进在于利用`pd.json_normalize()`函数简化了数据结构，提高了数据处理的效率，并减少了数据存储时的复杂度。在实际工作中，这样的处理方式对于有效管理和分析大量JSON数据尤其重要。