更新 机器学习.md

This commit is contained in:
admin 2025-06-10 06:54:57 +00:00
parent 93e637e0a9
commit cc5a773803

View File

@ -143,4 +143,3 @@
- 递归特征消除Recursive Feature Elimination, RFE1从全部特征开始训练一个基线模型2使用模型如决策树、随机森林等评估每个特征重要性3. 根据特征重要性选择一定数量特征进行消除4递归在消除了部分特征的数据集上重新训练模型并重复2和35最终选择在多次迭代后保留下来的特征。优势在于可使RFE能够识别出那些在组合中对模型性能有显著影响的特征。
- 随机稀疏模型 (Randomized sparse models): 多次随机选取特征训练如L1稀疏模型以被稀疏模型选中为非零特征的次数来排序。
- 要同时选中高相关特征的重要性除了过滤法外也有改进RF的Boruta通过随机打乱原始特征的值为数据集中的每个特征创建影子特征将影子特征添加到原始数据集中形成扩展数据集并用其训练随机森林模型在每次迭代中比较每个原始特征的重要性与影子特征的最高重要性若原始特征的重要性高于影子特征的最高值则认为该特征是重要的Hit否则是不重要的Miss重复上述过程多次通常100次统计每个特征的“命中”次数和“未命中”次数根据统计结果将特征分为“重要”、“不重要”和“不确定”三类重要特征被保留不重要特征被剔除而不确定特征则根据设定的迭代次数或阈值进一步判断