AI-0007-数据预处理:归一化、标准化等基本方法

2020-04-23 16:46:5203:04 152
声音简介

为什么数据需要预处理呢?答案很简单,就是因为训练数据中存在空值、非数字值等情形,而且不在同一规模等级(scale),因此必须将特征值拉齐为同一比例才能用于模型的训练。
数据预处理的技术实现包括:插值技术、名义特征、序数特征、数值特征、虚拟特征、独热编码等,用于解决丢失数据填充、特征值相互转换的问题。

用户评论

表情0/300
喵,没有找到相关结果~
暂时没有评论,下载喜马拉雅与主播互动
猜你喜欢
大数据|数据库|数据分析

数据库技术:关系型:PostgreSQL,MySQL,键值对:Redis,Geode,宽列:Cassandra,Hbase,文档:MongoDB,CouchDB...

by:架构师研究会

云数据中心-大数据和AI的摇篮

数据中心搭建与运维最佳实践分享平台谨以此专辑为中国企业和个人用户持续分享IT系统架构设计落地的最佳实践!个人微信公众号:“PMP管理交流平台”同步分享相关文...

by:伯牙老师

数据治理与数据安全|AI电子书

【内容简介】随着数字经济时代的到来,数据的价值不断被发掘。但是,围绕数据价值的挖掘也山现了诸多问题。例如,凶为数据过于海量以及数据产权不明确导致用户不会用,凶数...

by:人民邮电_电子书

数据眼

【内容简介】现代世界,信息爆炸,无穷数据充斥身边。图像、声音、文字、编码……数据与人心结合,构成一个个世界,千般世界,有历史分歧,有科技分叉,但万变不离人心。执...

by:千烨文

数据治理-大数据时代,如何治理数据资产

可以加VX:avtech9获得课件,记得备注"数据治理"。●数字化时代,企业如何让数据发挥出更好的价值?你需要这样一套数据治理方法。艾威数据治理系列课程共9堂课...

by:艾威培训

数据架构,大数据,数据仓库以及data vault

企业数据,大数据,数据仓库,业务系统,架构,数据基础设施,企业数据分析,数据简史,并行处理,非结构化数据,文本消歧,结构化数据,数据架构简史

by:科技散人

数据之巅

《数据之巅:大数据革命,历史、现实与未来》从美国建国之基讲起,通过阐述初数时代、内战时代、镀金时代、进步时代、抽样时代、大数据时代的特征,系统梳理了美国数据文化...

by:诸葛老母

数据之巅

数据,自古就有,人口普查、农业统计、军事战争、政治计算……数据虽小,却有助于治国安邦。美国之所以繁荣鼎盛,数据文化根基牢不可破概是主因之一。信息...

by:1_5vn8tt

数据散修

【内容简介】天雷乍响之后,世上诞生的一只妖孽……“请问金宇星同学,52530这个数字代表什么?”“呃…5(身体强度)+25(精神强度)=30(综合强度)!”...

by:燚焱传媒_悠然