博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
缺失值处理知识点整理
阅读量:4222 次
发布时间:2019-05-26

本文共 246 字,大约阅读时间需要 1 分钟。

缺失值处理

来源《Python数据分析与数据化运营》
批注1:
(丢弃)不宜采用的场景:
(1)数据集总体中存在大量的数据记录不完整情况且比例较大,例如超过10%,删除这些带有缺失值的记录意味着将会损失过多有用信息。
(2)带有缺失值的数据记录大量存在着明显的数据分布规律或特征,例如带有缺失值的数据记录的label主要集中于某一类或者某积累,如果删除会导致对应的数据样本丢失大量特征信息,导致模型过拟合或分类不准确
批注2:
(插值)方法
拉格朗日插值
牛顿插值
Hermite插值
分段插值
样条插值

你可能感兴趣的文章
Spring容器启动流程(下)
查看>>
Spring Bean初始化实例
查看>>
深入理解Spring AOP实现
查看>>
Spring 事务管理
查看>>
重学多线程(一)—— 线程简介
查看>>
重学多线程(二)—— 线程间的通信
查看>>
重学多线程(三)—— 锁
查看>>
重学多线程(四)—— 线程池
查看>>
重学Java集合类(一)—— 集合类简介
查看>>
重学多线程(五)—— Unsafe类
查看>>
重学Java集合类(二)—— List接口
查看>>
重学Java集合类(三)—— Map接口(上)
查看>>
重学Java集合类(三)—— Map接口(下)
查看>>
重学Java集合类(四)—— Set接口
查看>>
重学Java集合类(五)—— 集合类的遍历
查看>>
重学Java虚拟机(一)—— JVM内存模型
查看>>
重学Java虚拟机(二)—— JVM内存管理
查看>>
重学Java虚拟机(三)—— Java类文件结构
查看>>
重学Java虚拟机(四)—— 类加载机制
查看>>
重学Java集合类(六)—— 红黑树和TreeMap
查看>>