We developed MLHO (pronounced as melo), an end-to-end Machine Learning framework that leverages iterative feature and algorithm selection to predict Health Outcomes. MLHO implements iterative sequential representation mining, and feature and model selection, for predicting the patient-level risk of hospitalization, ICU admission, need for mechanical ventilation, and death. It bases this prediction on data from patients' past medical records (before their COVID-19 infection). MLHO's architecture enables a parallel and outcome-oriented model calibration, in which different statistical learning algorithms and vectors of features are simultaneously tested to improve the prediction of health outcomes. Using clinical and demographic data from a large cohort of over 13,000 COVID-19-positive patients, we modeled the four adverse outcomes utilizing about 600 features representing patients' pre-COVID health records and demographics. The mean AUC ROC for mortality prediction was 0.91, while the prediction performance ranged between 0.80 and 0.81 for the ICU, hospitalization, and ventilation. We broadly describe the clusters of features that were utilized in modeling and their relative influence for predicting each outcome. Our results demonstrated that while demographic variables (namely age) are important predictors of adverse outcomes after a COVID-19 infection, the incorporation of the past clinical records are vital for a reliable prediction model. As the COVID-19 pandemic unfolds around the world, adaptable and interpretable machine learning frameworks (like MLHO) are crucial to improve our readiness for confronting the potential future waves of COVID-19, as well as other novel infectious diseases that may emerge.


翻译:我们开发了MLHO(称为Melo),这是一个利用迭代功能和算法选择来预测健康结果的端到端机器学习框架。MLHO实施迭代连续代代代表性挖掘以及特征和模型选择,以预测病人住院、ICU住院、机械通风和死亡的风险;根据病人过去医疗记录的数据(在感染COVID-19之前)进行这一预测;MLHO的架构可以进行平行和面向结果的模型校准,在模型中同时测试不同的前方统计算法和特征矢量,以改进对健康结果的预测。利用大量13 000名COVID-19阳性病人的临床和人口数据,我们用代表病人前COVI健康记录和人口学的大约600个特征来模拟四种不利结果。AUC 用于死亡率预测的平均值为0.91,而对于ICU、住院和通风的新模型的预测表现介于0.80和0.81之间。我们广泛描述在模型中所使用的各种特征的组合,以及它们对于预测每项结果的相对影响。我们用临床-19阳性病人的临床结果的临床数据数据数据数据数据数据模型的预测表明,一个关键的CVI作为重要的历史变量的预测结果的可靠,而对于过去的COVI的预测则是一个关键的CVLVLVA的预测,一个重要的历史变现成,对于过去的重要的精确的预测结果是:CRV的预测结果,作为主要的CRV的结果。

0
下载
关闭预览

相关内容

Linux导论,Introduction to Linux,96页ppt
专知会员服务
81+阅读 · 2020年7月26日
计算机视觉用于新冠病毒COVID-19的控制综述,25页pdf
专知会员服务
53+阅读 · 2020年4月22日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
105+阅读 · 2019年10月9日
鲁棒机器学习相关文献集
专知
8+阅读 · 2019年8月18日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
已删除
将门创投
3+阅读 · 2018年8月21日
【推荐】卷积神经网络类间不平衡问题系统研究
机器学习研究会
6+阅读 · 2017年10月18日
【论文】图上的表示学习综述
机器学习研究会
15+阅读 · 2017年9月24日
【推荐】Python机器学习生态圈(Scikit-Learn相关项目)
机器学习研究会
6+阅读 · 2017年8月23日
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
Arxiv
0+阅读 · 2021年3月1日
Arxiv
3+阅读 · 2018年3月21日
VIP会员
相关VIP内容
Linux导论,Introduction to Linux,96页ppt
专知会员服务
81+阅读 · 2020年7月26日
计算机视觉用于新冠病毒COVID-19的控制综述,25页pdf
专知会员服务
53+阅读 · 2020年4月22日
【干货书】真实机器学习,264页pdf,Real-World Machine Learning
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
105+阅读 · 2019年10月9日
相关资讯
鲁棒机器学习相关文献集
专知
8+阅读 · 2019年8月18日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
已删除
将门创投
3+阅读 · 2018年8月21日
【推荐】卷积神经网络类间不平衡问题系统研究
机器学习研究会
6+阅读 · 2017年10月18日
【论文】图上的表示学习综述
机器学习研究会
15+阅读 · 2017年9月24日
【推荐】Python机器学习生态圈(Scikit-Learn相关项目)
机器学习研究会
6+阅读 · 2017年8月23日
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
Top
微信扫码咨询专知VIP会员