高级检索
当前位置: 首页 > 详情页

基于多模型机器学习算法预测体外受精累积活产率的研究

Prediction of cumulative live birth rate in in vitro fertilization using multi-model machine learning algorithms

文献详情

资源类型:

收录情况: ◇ 统计源期刊 ◇ 北大核心 ◇ 中华系列

机构: [1]保定市妇幼保健院生殖医学科,保定 071000 [2]河北大学附属医院儿科,保定 071000 [3]保定市第二医院检验科,保定 071000
出处:
ISSN:

关键词: 体外受精 累积活产率 预测模型 极端梯度提升树 SHAP

摘要:
目的:开发和验证体外受精累积活产率(cumulative live birth rate,CLBR)的机器学习预测模型,并通过SHAP值分析模型的重要特征。方法:本研究基于2017年1月至2022年12月在保定市妇幼保健院生殖医学科接受体外受精-胚胎移植治疗患者的回顾性数据,共1 792个周期。根据活产结局分为活产组( n=1 036)和非活产组( n=756)。数据集被随机分割为训练集和验证集(比例7∶3)。模型开发采用5种算法:逻辑回归、随机森林、极端梯度提升树(extreme gradient boosting,XGBoost)、支持向量机和神经网络。通过受试者工作特征曲线下面积(area under the curve,AUC)、F1分数和校准曲线评估模型性能,并使用临床决策曲线(decision curve analysis,DCA)分析评估模型的临床应用价值。采用SHAP值分析XGBoost模型的特征重要性,以提升模型解释性。 结果:XGBoost模型在预测CLBR方面表现最佳,测试集数据的准确率为72.44%,AUC达到0.775,F1分数为0.654,准确率和F1分数均优于逻辑回归(准确率为70.02%,F1分数为0.585)、随机森林(准确率为71.69%,F1分数为0.606)、支持向量机(准确率为70.20%,F1分数为0.607)和神经网络(准确率为68.72%,F1分数为0.560)。XGBoost的校准曲线接近对角线,表明它们的预测概率与实际结果非常接近,具有良好的预测校准度。DCA分析结果表明,在大多数临床决策阈值范围内,XGBoost模型均提供了较高的净获益。SHAP值分析显示,体外受精失败次数、窦卵泡计数、抗苗勒管激素水平、精子正常形态率和精子DNA碎片指数是预测CLBR的关键特征。结论:XGBoost模型在预测CLBR方面具有良好的预测能力和校准度,并通过SHAP值提供重要特征的解释性,可为临床制定个性化治疗策略提供有力支持。然而,模型的泛化能力尚需通过外部数据验证,以确保其在不同人群中的适用性。

基金:

基金编号: 20232036

语种:
第一作者:
第一作者机构: [1]保定市妇幼保健院生殖医学科,保定 071000
通讯作者:
推荐引用方式(GB/T 7714):

资源点击量:15709 今日访问量:3 总访问量:1038 更新日期:2025-06-01 建议使用谷歌、火狐浏览器 常见问题

版权所有©2020 河北大学附属医院 技术支持:重庆聚合科技有限公司 地址:保定市莲池区裕华东路212号