Scikit-learn

来自Shiyin's note

Shen（讨论 | 贡献）2022年1月16日 (日) 12:56的版本（→‎随机森林）

(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)

跳到导航跳到搜索

python中的机器学习软件库：[1]

Installed package of scikit-learn can be accelerated using scikit-learn-intelex. More details are available here: https://intel.github.io/scikit-learn-intelex. For example:

       $ conda install scikit-learn-intelex
       $ python -m sklearnex my_application.py

包

MLPRegressor回归，参考 http://www.weixueyuan.net/a/914.html

随机森林

参考 [2] [3]
n_estimators：随机森林中「树」的数量。
max_features：每个分割处的特征数。

max_features = 'sqrt' 这意味着如果有16个特征，则在每个树中的每个节点处，只考虑4个随机特征来拆分节点。

max_depth：每棵树可以拥有的最大「分裂」数。
min_samples_split：在树的节点分裂前所需的最少观察数。
min_samples_leaf：每棵树末端的叶节点所需的最少观察数。
bootstrap：是否使用 bootstrapping 来为随机林中的每棵树提供数据。（bootstrapping 是从数据集中进行替换的随机抽样。）
n_jobs: 可以决定要使用多少处理器内核来运行模型。设置「n_jobs = -1」将使模型运行最快，因为它使用了所有计算机核心。

取自“http://202.127.29.3/~shen/wiki/index.php?title=Scikit-learn&oldid=3695”

导航菜单