全网整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:400-708-3566

Python解析JSON接口数据_嵌套结构处理方法【指导】

推荐用 dict.get() 链式调用并设合理默认值(如{}或[])安全访问嵌套JSON;深度大时封装 safe_get 或用 jsonpath-ng 提取;结构化数据转 DataFrame 用 pd.json_normalize();统一清洗 None/""/"null" 等空值。

遇到 KeyError 说明没处理好嵌套层级

JSON 数据里经常有 datalist[0]userprofile 这种多层嵌套,直接写 res['data']['list'][0]['user']['profile']['name'] 很容易在某一层为空或缺失字段时抛 KeyErrorTypeError

推荐用 dict.get() 链式调用,配合默认值兜底:

name = (
    res
    .get('data', {})
    .get('list', [{}])[0]
    .get('user', {})
    .get('profile', {})
    .get('name', '未知')
)
  • 每层都用 .get(key, default),避免崩;default 选空字典或空列表,方便后续继续链式调用
  • [0] 这种索引操作不能用 get,得先确保列表存在且非空——所以前面要用 .get('list', [{}]) 提供安全兜底
  • 如果结构深度大、访问频繁,建议封装成函数,比如 safe_get(res, 'data.list.0.user.profile.name', '未知')

用 jsonpath-ng 解析深层嵌套更灵活

当嵌套结构不固定(比如 items 下可能有 productservice 两种类型),或者要批量提取同名字段(如所有 id),硬写 .get() 会很累。

jsonpath-ng 是 Python 里最接近 JavaScript 的 lodash.get + jq 的组合:

from jsonpath_ng import parse
from jsonpath_ng.ext import parse as ext_parse
from jsonpath_ng.jsonpath import DatumInContext

安装:pip install jsonpath-ng

json_data = {"results": [{"id": 1, "tags": ["a", "b"]}, {"id": 2, "tags": ["c"]}]} jsonpath_expr = ext_parse('$.results[*].id') matches = [match.value for match in jsonpath_expr.find(json_data)]

→ [1, 2]

  • $.results[*].id 可以跳过中间层数,直接取所有 id[*] 自动处理列表,不用手动写 [0][1]
  • 支持过滤:$.results[?(@.tags.length > 1)] 找出 tags 长度大于 1 的项
  • 注意:原生 jsonpath-ng 不支持 ..(递归下降),要用 ext_parse;但也不支持 filter 里的复杂表达式,比如 @.x == @.y 会报错

把嵌套 JSON 扁平化成 pandas DataFrame

接口返回的是树状结构,但你真正要分析的是“每个用户对应几个订单”,这种一对多关系直接转 pd.DataFrame 会出错——pandas 会把整个子对象塞进一个单元格。

正确做法是先用 pd.json_normalize() 拆解:

import pandas as pd

data = { "users": [ { "id": 1, "name": "Alice", "orders": [{"oid": "A001", "amount": 99}, {"oid": "A002", "amount": 150}] }, { "id": 2, "name": "Bob", "orders": [{"oid": "B001", "amount": 78}] } ] }

展开 users,同时把 orders 拆成多行(record_path)

df = pd.json_normalize( data['users'], record_path='orders', meta=['id', 'name'], errors='ignore' )

→ 三行:Alice 两条订单,Bob 一条

  • record_path 指定要“炸开”的嵌套列表字段;meta 指定要保留的父级字段
  • 如果 orders 缺失,加 errors='ignore' 防止中断;也可以用 meta_prefix 给父级字段加前缀避免重名
  • 不支持多层嵌套展开(比如 orders.items.discount),得先用 jsonpath-ng 或递归预处理

None 和空字符串混用导致数据清洗失败

很多接口对“无值”字段返回 null(Python 里是 None),但有些又返回空字符串 ""、空列表 [],甚至 "null" 字符串。不做统一清理,后续 str.upper()len() 就会报错。

  • 别用 if not x: 判断是否为空——它会把 0False 也当成空,而这些可能是合法值
  • 明确检查类型:x is Noneisinstance(x, str) and not x.strip()isinstance(x, list) and not x
  • 建议在解析后立刻做一次清洗,例如写个 clean_value(v) 函数,把 None"""null" 都转成统一的 None,再交给下游逻辑

嵌套深不可怕,可怕的是每一层都靠运气判断是否存在。真正省时间的做法,不是写更多 try/except,而是从第一行解析开始就建立“防御性访问”习惯——尤其是 .get() 的默认值选什么,决定了后面要不要写十行校验代码。


# javascript  # python  # java  # js  # json  # 数据清洗 


相关文章: 建站org新手必看:2024最新搭建流程与模板选择技巧  ,制作一个手机app网站要多少钱?  常州自助建站:操作简便模板丰富,企业个人快速搭建网站  制作网站怎么制作,*游戏网站怎么搭建?  如何在Windows环境下新建FTP站点并设置权限?  胶州企业网站制作公司,青岛石头网络科技有限公司怎么样?  Thinkphp 中 distinct 的用法解析  如何通过万网虚拟主机快速搭建网站?  建站之星安装路径如何正确选择及配置?  建站DNS解析失败?如何正确配置域名服务器?  建站之星如何快速更换网站模板?  网站制作免费,什么网站能看正片电影?  如何通过西部建站助手安装IIS服务器?  西安大型网站制作公司,西安招聘网站最好的是哪个?  建站之星后台搭建步骤解析:模板选择与产品管理实操指南  c++如何打印函数堆栈信息_c++ backtrace函数与符号名解析【方法】  网站视频制作书签怎么做,ie浏览器怎么将网站固定在书签工具栏?  建站主机默认首页配置指南:核心功能与访问路径优化  网站专业制作公司,网站编辑是做什么的?好做吗?工作前景如何?  东莞专业网站制作公司有哪些,东莞招聘网站哪个好?  详解jQuery停止动画——stop()方法的使用  建站之星收费标准详解:套餐费用及年费价格表一览  香港服务器部署网站为何提示未备案?  网站微信制作软件,如何制作微信链接?  定制建站方案优化指南:企业官网开发与建站费用解析  定制建站是什么?如何实现个性化需求?  潍坊网站制作公司有哪些,潍坊哪家招聘网站好?  C#怎么创建控制台应用 C# Console App项目创建方法  官网建站费用明细查询_企业建站套餐价格及收费标准指南  制作门户网站的参考文献在哪,小说网站怎么建立?  已有域名和空间,如何快速搭建网站?  北京营销型网站制作公司,可以用python做一个营销推广网站吗?  建站之星备案是否影响网站上线时间?  建站之星ASP如何实现CMS高效搭建与安全管理?  广州网站制作公司哪家好一点,广州欧莱雅百库网络科技有限公司官网?  建站之星如何开启自定义404页面避免用户流失?  网站制作中优化长尾关键字挖掘的技巧,建一个视频网站需要多少钱?  如何在阿里云购买域名并搭建网站?  测试制作网站有哪些,测试性取向的权威测试或者网站?  网页制作模板网站推荐,网页设计海报之类的素材哪里好?  建站之星CMS五站合一模板配置与SEO优化指南  网站制作外包价格怎么算,招聘网站上写的“外包”是什么意思?  实现点击下箭头变上箭头来回切换的两种方法【推荐】  孙琪峥织梦建站教程如何优化数据库安全?  如何设置并定期更换建站之星安全管理员密码?  如何选择可靠的免备案建站服务器?  如何在新浪SAE免费搭建个人博客?  深圳网站制作的公司有哪些,dido官方网站?  招贴海报怎么做,什么是海报招贴?  如何在宝塔面板创建新站点? 

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。