基于机器学习的环境监测数据对循环系统疾病死亡影响及预测预警模型构建. 王琰, 胥美美, 童俞嘉, 苟欢, 蔡荣, 单治易, & 安新颖 数据分析与知识发现. 📗\textless北大核心, CSSCI, CSCD\textgreater
基于机器学习的环境监测数据对循环系统疾病死亡影响及预测预警模型构建 [link]Paper  abstract   bibtex   
[目的]利用机器学习对循环系统疾病死亡构建预测预警模型及评价,为疾病的预防提供参考。[方法]使用中国某地区2014-2018年循环系统疾病死亡数据进行分析,采用GAM、RF、XGBoost构建预测模型。分布滞后非线性模型计算累计滞后效应结果构建预警模型,进行模型评价。[结果]累计滞后效应发现持续低温高温、高日照时数、高环境污染物浓度会增加循环系统疾病死亡风险,累计七天的相对危险度分别为1.236、1.130、1.56、1.062、1.218、1.153、1.796。RF、XGBoost模型RMSE为4.979、5.341性能较好。年龄、性别、气温、日照时数、SO_(2)、NO_(2)、CO、O_(3)、PM_(10)、PM_(2.5)浓度为筛选出的特征变量,将累计滞后效应筛选后的数据确定预警值预警效果较好。XGBoost预测结果的灵敏度、特异度、曲线下面积分别为0.948、0.939、0.941。[局限]缺乏伴随疾病独立数据和疾病发展进程数据。[结论]该地区死亡数增加与高年龄、男性、温度、日照时数、污染物浓度的升高有关。利用XGBoost模型构建的预测预警模型性能好,可为相关部门疾病的预防和干预提供参考价值。
@article{__nodate,
	title = {基于机器学习的环境监测数据对循环系统疾病死亡影响及预测预警模型构建},
	issn = {2096-3467},
	url = {https://kns.cnki.net/KCMS/detail/detail.aspx?dbcode=CAPJ&dbname=CAPJLAST&filename=XDTQ20220415002&v=},
	abstract = {[目的]利用机器学习对循环系统疾病死亡构建预测预警模型及评价,为疾病的预防提供参考。[方法]使用中国某地区2014-2018年循环系统疾病死亡数据进行分析,采用GAM、RF、XGBoost构建预测模型。分布滞后非线性模型计算累计滞后效应结果构建预警模型,进行模型评价。[结果]累计滞后效应发现持续低温高温、高日照时数、高环境污染物浓度会增加循环系统疾病死亡风险,累计七天的相对危险度分别为1.236、1.130、1.56、1.062、1.218、1.153、1.796。RF、XGBoost模型RMSE为4.979、5.341性能较好。年龄、性别、气温、日照时数、SO\_(2)、NO\_(2)、CO、O\_(3)、PM\_(10)、PM\_(2.5)浓度为筛选出的特征变量,将累计滞后效应筛选后的数据确定预警值预警效果较好。XGBoost预测结果的灵敏度、特异度、曲线下面积分别为0.948、0.939、0.941。[局限]缺乏伴随疾病独立数据和疾病发展进程数据。[结论]该地区死亡数增加与高年龄、男性、温度、日照时数、污染物浓度的升高有关。利用XGBoost模型构建的预测预警模型性能好,可为相关部门疾病的预防和干预提供参考价值。},
	language = {zh-CN},
	journal = {数据分析与知识发现},
	author = {{王琰} and {胥美美} and {童俞嘉} and {苟欢} and {蔡荣} and {单治易} and {安新颖}},
	note = {📗{\textless}北大核心, CSSCI, CSCD{\textgreater}},
	keywords = {/unread, DLNM, Prediction and early warning model, Random Forest, XGBoost, ⛔ No DOI found, 循环系统疾病, 随机森林模型 Circulatory diseases, 预测预警模型},
	pages = {1--16},
}

Downloads: 0