全网整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:400-708-3566

python数据预处理之将类别数据转换为数值的方法

在进行python数据分析的时候,首先要进行数据预处理。

有时候不得不处理一些非数值类别的数据,嗯, 今天要说的就是面对这些数据该如何处理。

目前了解到的大概有三种方法:

1,通过LabelEncoder来进行快速的转换;

2,通过mapping方式,将类别映射为数值。不过这种方法适用范围有限;

3,通过get_dummies方法来转换。

import pandas as pd
from io import StringIO

csv_data = '''A,B,C,D
1,2,3,4
5,6,,8
0,11,12,'''

df = pd.read_csv(StringIO(csv_data))
print(df)
#统计为空的数目
print(df.isnull().sum())
print(df.values)

#丢弃空的
print(df.dropna())
print('after', df)
from sklearn.preprocessing import Imputer
# axis=0 列  axis = 1 行
imr = Imputer(missing_values='NaN', strategy='mean', axis=0)
imr.fit(df) # fit 构建得到数据
imputed_data = imr.transform(df.values) #transform 将数据进行填充
print(imputed_data)

df = pd.DataFrame([['green', 'M', 10.1, 'class1'],
          ['red', 'L', 13.5, 'class2'],
          ['blue', 'XL', 15.3, 'class1']])
df.columns =['color', 'size', 'price', 'classlabel']
print(df)

size_mapping = {'XL':3, 'L':2, 'M':1}
df['size'] = df['size'].map(size_mapping)
print(df)

## 遍历Series
for idx, label in enumerate(df['classlabel']):
  print(idx, label)

#1, 利用LabelEncoder类快速编码,但此时对color并不适合,
#看起来,好像是有大小的
from sklearn.preprocessing import LabelEncoder
class_le = LabelEncoder()
color_le = LabelEncoder()
df['classlabel'] = class_le.fit_transform(df['classlabel'].values)
#df['color'] = color_le.fit_transform(df['color'].values)
print(df)

#2, 映射字典将类标转换为整数
import numpy as np
class_mapping = {label: idx for idx, label in enumerate(np.unique(df['classlabel']))}
df['classlabel'] = df['classlabel'].map(class_mapping)
print('2,', df)


#3,处理1不适用的
#利用创建一个新的虚拟特征
from sklearn.preprocessing import OneHotEncoder
pf = pd.get_dummies(df[['color']])
df = pd.concat([df, pf], axis=1)
df.drop(['color'], axis=1, inplace=True)
print(df)

以上这篇python数据预处理之将类别数据转换为数值的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。


# python数值转换  # Python多进程模式实现多核CPU并行计算  # python multiprocessing 多进程并行计算的操作  # Python基于pyCUDA实现GPU加速并行计算功能入门教程  # Python 多核并行计算的示例代码  # python数据预处理之数据标准化的几种处理方式  # python实现数据预处理之填充缺失值的示例  # Python数据预处理之数据规范化(归一化)示例  # Python----数据预处理代码实例  # python数据预处理 :样本分布不均的解决(过采样和欠采样)  # python 删除excel表格重复行  # 数据预处理操作  # Python Joblib库使用方法案例总结  # 给大家  # 转换为  # 是有  # 遍历  # 希望能  # 该如何  # 这篇  # 方法来  # 创建一个  # 小编  # 有三种  # 不适用  # 大家多多  # 为空  # 这种方法  # csv_data  # io  # df  # read_csv  # StringIO 


相关文章: 建站与域名管理如何高效结合?  如何用已有域名快速搭建网站?  如何在香港免费服务器上快速搭建网站?  活动邀请函制作网站有哪些,活动邀请函文案?  高防服务器租用首荐平台,企业级优惠套餐快速部署  在线教育网站制作平台,山西立德教育官网?  外贸公司网站制作,外贸网站建设一般有哪些步骤?  如何用PHP快速搭建CMS系统?  如何在香港服务器上快速搭建免备案网站?  建站主机默认首页配置指南:核心功能与访问路径优化  创业网站制作流程,创业网站可靠吗?  如何通过服务器快速搭建网站?完整步骤解析  如何用手机制作网站和网页,手机移动端的网站能制作成中英双语的吗?  建站之星如何保障用户数据免受黑客入侵?  网站app免费制作软件,能免费看各大网站视频的手机app?  如何在新浪SAE免费搭建个人博客?  ,南京靠谱的征婚网站?  常州自助建站费用包含哪些项目?  建站之星展会模版如何一键下载生成?  mc皮肤壁纸制作器,苹果平板怎么设置自己想要的壁纸我的世界?  如何通过老薛主机一键快速建站?  如何通过主机屋免费建站教程十分钟搭建网站?  如何自定义建站之星网站的导航菜单样式?  如何通过云梦建站系统实现SEO快速优化?  娃派WAP自助建站:免费模板+移动优化,快速打造专业网站  沈阳制作网站公司排名,沈阳装饰协会官方网站?  建站之星logo尺寸如何设置最合适?  电影网站制作价格表,那些提供免费电影的网站,他们是怎么盈利的?  巅云智能建站系统:可视化拖拽+多端适配+免费模板一键生成  专业网站建设制作报价,网页设计制作要考什么证?  建站之星安装后界面空白如何解决?  较简单的网站制作软件有哪些,手机版网页制作用什么软件?  如何生成腾讯云建站专用兑换码?  小型网站制作HTML,*游戏网站怎么搭建?  建站主机解析:虚拟主机配置与服务器选择指南  历史网站制作软件,华为如何找回被删除的网站?  小米网站链接制作教程,请问miui新增网页链接调用服务有什么用啊?  XML的“混合内容”是什么 怎么用DTD或XSD定义  简易网站制作视频教程,使用记事本编写一个简单的网页html文件?  官网网站制作腾讯审核要多久,联想路由器newifi官网  如何破解联通资金短缺导致的基站建设难题?  建站168自助建站系统:快速模板定制与SEO优化指南  C++用Dijkstra(迪杰斯特拉)算法求最短路径  公司网站制作价格怎么算,公司办个官网需要多少钱?  如何快速上传建站程序避免常见错误?  百度网页制作网站有哪些,谁能告诉我百度网站是怎么联系?  如何通过FTP空间快速搭建安全高效网站?  如何规划企业建站流程的关键步骤?  如何用IIS7快速搭建并优化网站站点?  东莞专业网站制作公司有哪些,东莞招聘网站哪个好? 

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。