分享
调参总结
输入“/”快速插入内容
调参总结
飞书用户3193
2023年5月22日修改
一、特征工程处理
参考:
https://blog.csdn.net/huangguohui_123/article/details/111179672
对数处理
1、why
(1) 缩小数据之间的绝对差异;避免个别极端值的影响
(2) 尽可能满足经典
线性模型假定
(Classic Linear Model)
避免共线性
避免
异方差
,满足同方差基本假定 :
取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度, 让方差恒定,即让波动相对稳定, 消除异方差问题
尽可能符合正态分布
(3) 经济学意义
用线性模型估计非线性关系
2、
统计意义解读
3、原理
对数函数可以对大数值的范围进行压缩,对小数值的范围进行扩展,x越大,log(x)增长得越慢。
如对下图一这个分布进行对数变换,较小数据之间的差异将会变大(因为对数函数的斜率很大),而较大数据之间的差异将减少(因为该分布中较大数据的斜率很小)。如果你拓展了左尾的差异,减少了右尾的差异,结果将是方差恒定、形状对称的正态分布(无论均值大小如何)。
4、建模尝试
tips:
预测tsh 用前7天的tsh、宏鹄免b补率、
1、R^2 低可能的原因