3 个月前

基于链式方程的多重插补:实践中的问题与指导

基于链式方程的多重插补:实践中的问题与指导

摘要

多重插补法(Multiple Imputation by Chained Equations, MICE)是一种灵活且实用的处理缺失数据的方法。本文阐述了该方法的基本原理,展示了如何对分类变量和定量变量(包括偏态变量)进行插补。文中提供了构建插补模型的指导建议,并讨论了所需插补次数的确定原则。同时,介绍了对多重插补数据进行实际分析的方法,涵盖模型构建与模型检验过程。本文也强调了该方法的局限性,并探讨了可能存在的陷阱。为便于理解,文中结合心理健康领域的一个实际数据集进行说明,并提供相应的Stata代码片段。

基准测试

基准方法指标
multivariate-time-series-imputation-onMICE
MAE (PM2.5): 27.42
multivariate-time-series-imputation-on-1MICE
MAE (10% of data as GT): 0.634
multivariate-time-series-imputation-on-kddMICE
MSE (10% missing): 0.468
multivariate-time-series-imputation-on-uciMICE
MAE (10% missing): 0.477

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
基于链式方程的多重插补:实践中的问题与指导 | 论文 | HyperAI超神经