本教程详细介绍了如何将Pandas DataFrame中包含字典列表的复杂列解包并转换为结构化的新列。文章提供了两种主要方法:一种是利用`str[0]`和`apply(pd.Series)`进行直接转换,另一种则通过`where`和默认字典结构更健壮地处理缺失数据。通过具体代码示例,帮助读者高效地将嵌套数据扁平化,提升数据处理能力。
在数据分析和处理过程中,我们经常会遇到数据以嵌套结构存储的情况。例如,一个DataFrame的某一列可能包含列表,而列表中的元素又是字典。这种结构虽然在某些场景下便于存储,但在需要对字典内部的键值进行分析时,就需要将其“扁平化”为独立的列。
考虑以下一个典型的输入DataFrame df:
import pandas as pd
import numpy as np
df = pd.DataFrame(
{
"stats": [
[{"city": None, "last_time": 1234567}],
[],
[{"city": "Seattle", "last_time": 45678999876}]]
}
)
print("原始DataFrame:")
print(df)输出:
原始DataFrame:
stats
0 [{'city': None, 'last_time': 1234567}]
1 []
2 [{'city': 'Seattle', 'last_time': 45678999876}]我们的目标是将 stats 列中的字典内容提取出来,创建新的 city 和 last_time 列,并正确处理缺失或空列表的情况,使其达到以下期望输出:
city last_time 0 NaN 1234567.00 1 NaN NaN 2 Seattle 45678999876.00
(注意:None在Pandas中通常会被转换为NaN,NA通常也指代NaN。)
直接尝试 pd.DataFrame(df["stats"]) 无法达到预期,因为它只是将 Series 转换回 DataFrame,结构并未改变。我们需要更精细的方法来解包嵌套数据。
这种方法适用于列表中只包含一个字典,并且我们希望将空列表或列表中的None值自动转换为NaN的情况。
核心思路:
示例代码:
# 解决方案一:直接解包
output_df_method1 = df["stats"].str[0].apply(pd.Series)
print("\n解决方案一的输出:")
print(output_df_method1)输出:
解决方案一的输出:
city last_time
0 NaN 1234567.00
1 NaN NaN
2 Seattle 45678999876.00解释:
这种方法简洁高效,特别适合当空列表应被视为完全缺失数据的情况。
在某些情况下,我们可能希望对空列表或缺失数据进行更精细的控制,例如,将空列表对应的字典填充为具有特定默认值的字典,而不是简单的 NaN。
核心思路:
示例代码:
# 解决方案二:使用 where 和默认字典进行填充
stats_series = df["stats"].str[0]
# 定义一个默认字典模板,用于填充缺失的字典结构
template_dict = dict.fromkeys(["city", "last_time"]) # 结果为 {'city': None, 'last_time': None}
# 使用 where 方法,当 stats_series 中的值为 NaN 时,替换为 template_dict
filled_stats_series = stats_series.where(stats_series.notnull(), template_dict)
output_df_method2 = filled_stats_series.apply(pd.Series)
print("\n解决方案二的输出:")
print(output_df_method2)输出:
解决方案二的输出:
city last_time
0 NaN 1234567.00
1 None NaN
2 Seattle 45678999876.00解释:
output_df_method1['last_time'] = output_df_method1['last_time'].astype('Int64') # 使用Pandas的整数类型,支持NaN
# 或者
# output_df_method1['last_time'] = p
d.to_numeric(output_df_method1['last_time'], errors='coerce')将DataFrame中包含字典列表的复杂列扁平化是Pandas数据处理中的常见需求。通过掌握 .str[0] 和 .apply(pd.Series) 的组合,以及 .where() 结合默认字典的技巧,你可以高效且灵活地处理这类嵌套数据,将其转换为结构清晰、便于分析的表格形式。选择哪种方法取决于你对缺失数据的具体处理策略和对代码简洁性的偏好。
# app
# pandas
# 数据类型
# 字符串
# 值类型
# 字符串类型
# 类型转换
# 数据分析
# 转换为
# 将其
# 数据处理
# 第一个
# 多个
# 默认值
# 列表中
# 两种
# 但在
# 而不是
相关文章:
哈尔滨网站建设策划,哈尔滨电工证查询网站?
JS中使用new Date(str)创建时间对象不兼容firefox和ie的解决方法(两种)
网站图片在线制作软件,怎么在图片上做链接?
天津个人网站制作公司,天津网约车驾驶员从业资格证官网?
php能控制zigbee模块吗_php通过串口与cc2530 zigbee通信【介绍】
Android滚轮选择时间控件使用详解
制作电商网页,电商供应链怎么做?
网站代码制作软件有哪些,如何生成自己网站的代码?
详解ASP.NET 生成二维码实例(采用ThoughtWorks.QRCode和QrCode.Net两种方式)
建站之星多图banner生成与模板自定义指南
猪八戒网站制作视频,开发一个猪八戒网站,大约需要多少?或者自己请程序员,需要什么程序员,多少程序员能完成?
如何获取PHP WAP自助建站系统源码?
建站主机与虚拟主机有何区别?如何选择最优方案?
如何通过FTP空间快速搭建安全高效网站?
公司网站制作价格怎么算,公司办个官网需要多少钱?
如何在阿里云通过域名搭建网站?
Swift中循环语句中的转移语句 break 和 continue
,有什么在线背英语单词效率比较高的网站?
电影网站制作价格表,那些提供免费电影的网站,他们是怎么盈利的?
外贸公司网站制作哪家好,maersk船公司官网?
如何选择服务器才能高效搭建专属网站?
大同网页,大同瑞慈医院官网?
公司网站的制作公司,企业网站制作基本流程有哪些?
商务网站制作工程师,从哪几个方面把握电子商务网站主页和页面的特色设计?
,怎么用自己头像做动态表情包?
已有域名如何快速搭建专属网站?
官网网站制作腾讯审核要多久,联想路由器newifi官网
如何通过VPS建站无需域名直接访问?
小米网站链接制作教程,请问miui新增网页链接调用服务有什么用啊?
胶州企业网站制作公司,青岛石头网络科技有限公司怎么样?
建站之星安装后如何自定义网站颜色与字体?
广州网站建站公司选择指南:建站流程与SEO优化关键词解析
公司网站制作费用多少,为公司建立一个网站需要哪些费用?
无锡营销型网站制作公司,无锡网选车牌流程?
如何续费美橙建站之星域名及服务?
网站制作价目表怎么做,珍爱网婚介费用多少?
建站之星后台密码遗忘如何找回?
微信网站制作公司有哪些,民生银行办理公司开户怎么在微信网页上查询进度?
如何通过NAT技术实现内网高效建站?
外贸公司网站制作,外贸网站建设一般有哪些步骤?
建站之星如何实现五合一智能建站与营销推广?
宁波自助建站系统如何快速打造专业企业网站?
建站主机功能解析:服务器选择与快速搭建指南
C++如何将C风格字符串(char*)转换为std::string?(代码示例)
如何选择美橙互联多站合一建站方案?
ppt在线制作免费网站推荐,有什么下载免费的ppt模板网站?
保定网站制作方案定制,保定招聘的渠道有哪些?找工作的人一般都去哪里看招聘信息?
如何配置FTP站点权限与安全设置?
网站制作报价单模板图片,小松挖机官方网站报价?
如何通过免费商城建站系统源码自定义网站主题与功能?
*请认真填写需求信息,我们会在24小时内与您取得联系。