资源类型:
收录情况:
◇ 统计源期刊
◇ 北大核心
◇ 中华系列
文章类型:
机构:
[1]保定市妇幼保健院生殖医学科,保定 071000
[2]河北大学附属医院儿科,保定 071000
医疗
儿科
河北大学附属医院
[3]保定市第二医院检验科,保定 071000
出处:
ISSN:
关键词:
体外受精
累积活产率
预测模型
极端梯度提升树
SHAP
摘要:
目的:开发和验证体外受精累积活产率(cumulative live birth rate,CLBR)的机器学习预测模型,并通过SHAP值分析模型的重要特征。方法:本研究基于2017年1月至2022年12月在保定市妇幼保健院生殖医学科接受体外受精-胚胎移植治疗患者的回顾性数据,共1 792个周期。根据活产结局分为活产组(
n=1 036)和非活产组(
n=756)。数据集被随机分割为训练集和验证集(比例7∶3)。模型开发采用5种算法:逻辑回归、随机森林、极端梯度提升树(extreme gradient boosting,XGBoost)、支持向量机和神经网络。通过受试者工作特征曲线下面积(area under the curve,AUC)、F1分数和校准曲线评估模型性能,并使用临床决策曲线(decision curve analysis,DCA)分析评估模型的临床应用价值。采用SHAP值分析XGBoost模型的特征重要性,以提升模型解释性。
结果:XGBoost模型在预测CLBR方面表现最佳,测试集数据的准确率为72.44%,AUC达到0.775,F1分数为0.654,准确率和F1分数均优于逻辑回归(准确率为70.02%,F1分数为0.585)、随机森林(准确率为71.69%,F1分数为0.606)、支持向量机(准确率为70.20%,F1分数为0.607)和神经网络(准确率为68.72%,F1分数为0.560)。XGBoost的校准曲线接近对角线,表明它们的预测概率与实际结果非常接近,具有良好的预测校准度。DCA分析结果表明,在大多数临床决策阈值范围内,XGBoost模型均提供了较高的净获益。SHAP值分析显示,体外受精失败次数、窦卵泡计数、抗苗勒管激素水平、精子正常形态率和精子DNA碎片指数是预测CLBR的关键特征。结论:XGBoost模型在预测CLBR方面具有良好的预测能力和校准度,并通过SHAP值提供重要特征的解释性,可为临床制定个性化治疗策略提供有力支持。然而,模型的泛化能力尚需通过外部数据验证,以确保其在不同人群中的适用性。
基金:
河北省医学科学研究项目(20232036)
基金编号:
20232036
第一作者:
第一作者机构:
[1]保定市妇幼保健院生殖医学科,保定 071000
通讯作者:
推荐引用方式(GB/T 7714):
邢鹏,梁辉,陈英,等.基于多模型机器学习算法预测体外受精累积活产率的研究[J].中华生殖与避孕杂志.2025,45(4):358-364.