推荐用 dict.get() 链式调用并设合理默认值(如{}或[])安全访问嵌套JSON;深度大时封装 safe_get 或用 jsonpath-ng 提取;结构化数据转 DataFrame 用 pd.json_normalize();统一清洗 None/""/"null" 等空值。
JSON 数据里经常有 data → list → [0] → user → profile 这种多层嵌套,直接写 res['data']['list'][0]['user']['profile']['name'] 很容易在某一层为空或缺失字段时抛 KeyError 或 TypeError。
推荐用 dict.get() 链式调用,配合默认值兜底:
name = (
res
.get('data', {})
.get('list', [{}])[0]
.get('user', {})
.get('profile', {})
.get('name', '未知')
).get(key, default),避免崩;default 选空字典或空列表,方便后续继续链式调用[0] 这种索引操作不能用 get,得先确保列表存在且非空——所以前面要用 .get('list', [{}]) 提供安全兜底safe_get(res, 'data.list.0.user.profile.name', '未知')
当嵌套结构不固定(比如 items 下可能有 product 或 service 两种类型),或者要批量提取同名字段(如所有 id),硬写 .get() 会很累。
jsonpath-ng 是 Python 里最接近 JavaScript 的 lodash.get + jq 的组合:
from jsonpath_ng import parse from jsonpath_ng.ext import parse as ext_parse from jsonpath_ng.jsonpath import DatumInContext安装:pip install jsonpath-ng
json_data = {"results": [{"id": 1, "tags": ["a", "b"]}, {"id": 2, "tags": ["c"]}]} jsonpath_expr = ext_parse('$.results[*].id') matches = [match.value for match in jsonpath_expr.find(json_data)]
→ [1, 2]
$.results[*].id 可以跳过中间层数,直接取所有 id;[*] 自动处理列表,不用手动写 [0]、[1]
$.results[?(@.tags.length > 1)] 找出 tags 长度大于 1 的项jsonpath-ng 不支持 ..(递归下降),要用 ext_parse;但也不支持 filter 里的复杂表达式,比如 @.x == @.y 会报错接口返回的是树状结构,但你真正要分析的是“每个用户对应几个订单”,这种一对多关系直接转 pd.DataFrame 会出错——pandas 会把整个子对象塞进一个单元格。
正确做法是先用 pd.json_normalize() 拆解:
import pandas as pddata = { "users": [ { "id": 1, "name": "Alice", "orders": [{"oid": "A001", "amount": 99}, {"oid": "A002", "amount": 150}] }, { "id": 2, "name": "Bob", "orders": [{"oid": "B001", "amount": 78}] } ] }
展开 users,同时把 orders 拆成多行(record_path)
df = pd.json_normalize( data['users'
], record_path='orders', meta=['id', 'name'], errors='ignore' )
→ 三行:Alice 两条订单,Bob 一条
record_path 指定要“炸开”的嵌套列表字段;meta 指定要保留的父级字段orders 缺失,加 errors='ignore' 防止中断;也可以用 meta_prefix 给父级字段加前缀避免重名orders.items.discount),得先用 jsonpath-ng 或递归预处理很多接口对“无值”字段返回 null(Python 里是 None),但有些又返回空字符串 ""、空列表 [],甚至 "null" 字符串。不做统一清理,后续 str.upper() 或 len() 就会报错。
if not x: 判断是否为空——它会把 0、False 也当成空,而这些可能是合法值x is None、isinstance(x, str) and not x.strip()、isinstance(x, list) and not x
clean_value(v) 函数,把 None、""、"null" 都转成统一的 None,再交给下游逻辑嵌套深不可怕,可怕的是每一层都靠运气判断是否存在。真正省时间的做法,不是写更多 try/except,而是从第一行解析开始就建立“防御性访问”习惯——尤其是 .get() 的默认值选什么,决定了后面要不要写十行校验代码。
# javascript
# python
# java
# js
# json
# 数据清洗
相关文章:
建站org新手必看:2024最新搭建流程与模板选择技巧
,制作一个手机app网站要多少钱?
常州自助建站:操作简便模板丰富,企业个人快速搭建网站
制作网站怎么制作,*游戏网站怎么搭建?
如何在Windows环境下新建FTP站点并设置权限?
胶州企业网站制作公司,青岛石头网络科技有限公司怎么样?
Thinkphp 中 distinct 的用法解析
如何通过万网虚拟主机快速搭建网站?
建站之星安装路径如何正确选择及配置?
建站DNS解析失败?如何正确配置域名服务器?
建站之星如何快速更换网站模板?
网站制作免费,什么网站能看正片电影?
如何通过西部建站助手安装IIS服务器?
西安大型网站制作公司,西安招聘网站最好的是哪个?
建站之星后台搭建步骤解析:模板选择与产品管理实操指南
c++如何打印函数堆栈信息_c++ backtrace函数与符号名解析【方法】
网站视频制作书签怎么做,ie浏览器怎么将网站固定在书签工具栏?
建站主机默认首页配置指南:核心功能与访问路径优化
网站专业制作公司,网站编辑是做什么的?好做吗?工作前景如何?
东莞专业网站制作公司有哪些,东莞招聘网站哪个好?
详解jQuery停止动画——stop()方法的使用
建站之星收费标准详解:套餐费用及年费价格表一览
香港服务器部署网站为何提示未备案?
网站微信制作软件,如何制作微信链接?
定制建站方案优化指南:企业官网开发与建站费用解析
定制建站是什么?如何实现个性化需求?
潍坊网站制作公司有哪些,潍坊哪家招聘网站好?
C#怎么创建控制台应用 C# Console App项目创建方法
官网建站费用明细查询_企业建站套餐价格及收费标准指南
制作门户网站的参考文献在哪,小说网站怎么建立?
已有域名和空间,如何快速搭建网站?
北京营销型网站制作公司,可以用python做一个营销推广网站吗?
建站之星备案是否影响网站上线时间?
建站之星ASP如何实现CMS高效搭建与安全管理?
广州网站制作公司哪家好一点,广州欧莱雅百库网络科技有限公司官网?
建站之星如何开启自定义404页面避免用户流失?
网站制作中优化长尾关键字挖掘的技巧,建一个视频网站需要多少钱?
如何在阿里云购买域名并搭建网站?
测试制作网站有哪些,测试性取向的权威测试或者网站?
网页制作模板网站推荐,网页设计海报之类的素材哪里好?
建站之星CMS五站合一模板配置与SEO优化指南
网站制作外包价格怎么算,招聘网站上写的“外包”是什么意思?
实现点击下箭头变上箭头来回切换的两种方法【推荐】
孙琪峥织梦建站教程如何优化数据库安全?
如何设置并定期更换建站之星安全管理员密码?
如何选择可靠的免备案建站服务器?
如何在新浪SAE免费搭建个人博客?
深圳网站制作的公司有哪些,dido官方网站?
招贴海报怎么做,什么是海报招贴?
如何在宝塔面板创建新站点?
*请认真填写需求信息,我们会在24小时内与您取得联系。