
摘要
树提升是一种高效且广泛使用的机器学习方法。本文描述了一种名为XGBoost的可扩展端到端树提升系统,该系统被数据科学家广泛应用于许多机器学习挑战中,以实现最先进的结果。我们提出了一种针对稀疏数据的新颖稀疏感知算法以及用于近似树学习的加权分位数素描(weighted quantile sketch)。更重要的是,我们提供了关于缓存访问模式、数据压缩和分片的见解,以构建一个可扩展的树提升系统。通过结合这些见解,XGBoost能够在资源远少于现有系统的情况下处理超过数十亿个样本。
代码仓库
Javihaus/Auto-ML-app-with-dash
GitHub 中提及
agnesdeng/mixgb
GitHub 中提及
kwantommy/breast-cancer-diagnosis
GitHub 中提及
poyushen/classifaction
GitHub 中提及
jiangzhongkai/ifly-algorithm_challenge
GitHub 中提及
Automunge/AutoMunge
tf
GitHub 中提及
pierobeat/Hoax-News-Classification
GitHub 中提及
jlanday/Language-Detection
GitHub 中提及
KPIxLILU/Machine-Learning-Workshop
tf
GitHub 中提及
lucasmfaria/Machine-Learning-Capstone
GitHub 中提及
xiadanqing/Binary
GitHub 中提及
MrCat9/Sklearn_Note
GitHub 中提及
joezengcbs/mini_xgboost_from_scratch
GitHub 中提及
Hem7513/Decision-Trees-and-XGBoost-Algorithm-Documentation
pytorch
GitHub 中提及
mtorabirad/PricePrediction
GitHub 中提及
tqchen/xgboost
GitHub 中提及
bw2color/bw2color
tf
GitHub 中提及
dmlc/xgboost
官方
GitHub 中提及
jlanday/X-ray-Object-Classification
GitHub 中提及
heartyguy/AI-AngryBird-Eagle-Wing
GitHub 中提及
nsubbaian/FrequentistML
GitHub 中提及
osofr/xgboost
GitHub 中提及
360jinrong/GBST
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| humor-detection-on-200k-short-texts-for-humor-1 | XGBoost | F1-score: 0.813 |