学术中的渣渣排

JASP元分析202308092106

[[202308020931元分析教程_元分析中的基本概念、操作流程、模型选择以及代码分享笔记]]

Restricted ML method(Y)

Restricted maximum likelihood (REML)是一种改进的最大似然估计方法,通常用于方差分析和协方差结构分析中。它与普通最大似然(ML)估计的主要区别有:

  1. REML可以消除固定效应对方差组件估计的偏差。在含有固定效应的方差分析模型中,使用REML可以获得比ML更准确的方差组件估计。
  2. REML仅依赖于方差-协方差矩阵的比值,而不依赖矩阵的绝对值。因此它适用于小样本量情况。
  3. REML对失自由度进行了修正,因此当需要估计多个方差参数时,REML能够提供更可靠的估计。
  4. REML通常被认为是处理不平衡设计(missing data)更合适的方法。
  5. REML在运算上比ML复杂,迭代求解过程更慢。

总体来说,当需要对方差组件进行准确估计时,特别是在含有固定效应、小样本量或不平衡设计的情况下,REML是优于普通ML的选择。它通过消除固定效应的偏差,提供了更可靠的方差组件估计。

[[20230810干预措施因素与元素]]

Fixed Effects method(X)

固定效应(Fixed Effects)是处理面板数据和重复测量数据的一种重要方法。它的主要特点包括:

  1. 固定效应模型认为个体间差异是固定不变的。它利用个体内的信息来估计回归系数。
  2. 固定效应模型主要用于推断样本内的平均效应。当样本代表整个群体时,固定效应模型的结论可以推广到整个群体。
  3. 固定效应模型允许个体间差异和解释变量存在相关性。但它需要足够大的时间维度(T)来获得稳健的回归结果。
  4. 固定效应模型能够有效控制时间不变的 omitted variables,减少Endogeneity问题。
  5. 固定效应模型不能很好地推断到样本之外,其结果的外部Validity较差。
  6. 固定效应模型不能估计时间不变的回归变量的效应。需要采用其他方法。
  7. 固定效应模型的参数估计对样本外数据的预测能力较差。

总体来说,当需要控制个体差异,解决内生性问题,并对样本内平均效应进行推断时,固定效应模型是很好的选择。但它对小样本可能产生过拟合,具有一定局限性。需谨慎采用。

Maximum Likelihood method

最大似然估计(Maximum Likelihood Estimation, MLE)是一种统计参数估计方法,它通过最大化观测数据的似然函数来估计模型的参数。MLE方法有以下几个特点:

  1. 当样本量足够大时,它可以提供渐近无偏的参数估计。
  2. MLE方法可以同时估计多个参数,参数估计之间存在统计关系。
  3. MLE对数据分布的假设较少,适用于广泛的概率分布。
  4. MLE方法易于从数据中获得参数估计值,计算过程简单直观。
  5. MLE估计值满足渐近正常分布,可进行假设检验和构建置信区间。
  6. MLE需要复杂的数值优化算法求解,求解过程可能存在多个局部最优解。
  7. MLE方法对 Distribution Misspecification较敏感,容易产生偏差。

总体来说,MLE是一种有效、直观且易于实现的参数估计方法。但它对样本量和模型的正确性要求较高,应谨慎使用。需要结合问题场景来选择合适的估计方法。

Distribution Misspecification

Distribution Misspecification,中文翻译为“分布误指定”,指在建立统计模型时,对模型误差项的分布做出了错误的假定或指定。

举几个常见的Distribution Misspecification情况:

  1. 假定误差项服从正态分布,但真实误差项的分布存在肥尾现象。
  2. 将连续响应变量错误地假定为分类变量,指定了不合适的伯努利分布。
  3. 对计数数据假定为正态分布,而非泊松分布或负二项分布。
  4. 对存在过度分散的数据指定等离散分布,没有考虑过度分散。
  5. 对 panel 数据假定为独立同分布,而没有考虑相关性。

Distribution Misspecification会导致参数估计的偏倚和效率下降,进而影响模型效果。

识别Distribution Misspecification的方法包括图形诊断 Residual Analysis、Bootstrapping等。

避免Misspecification的方法包括:充分利用先验信息,进行参数稳健性检验,使用非参数和半参数方法等。

DerSimonian-Laird method

DerSimonian-Laird方法是随机效应模型元分析中估计校正因子的一种方法,主要应用于含有异质性的元分析研究。其主要特点有:

  1. DerSimonian-Laird方法基于随机效应模型,假设各研究的效应量是随机取样的。
  2. 它使用研究内方差和研究间方差来估计校正因子,从而校正个体研究的权重。
  3. 当元分析存在中等程度异质性时,DerSimonian-Laird方法能提供较为稳健的校正。
  4. 当研究数量较少时,DerSimonian-Laird方法可能会高估校正因子,导致过度校正。
  5. 与固定效应模型相比,DerSimonian-Laird方法对小样本和发表偏倚更为稳健。
  6. 需要预先进行异质性检验,以判断是否适合采用DerSimonian-Laird方法。
  7. 该方法实现简单,多数元分析软件中均有内置函数。

总之,DerSimonian-Laird方法适用于含有异质性的随机效应元分析,具有计算简便和结果稳健的优点,是较为推荐的校正方法。但其对小样本的校正效果仍有局限。

Hedges method(X)

Hedges方法是元分析中计算效应量的一种方法,主要用于校正基于小样本的效应量。其主要特点有:

  1. Hedges方法对基于小样本的效应量进行校正,可以减少小样本效应量被高估的偏差。
  2. 校正方法是在效应量的基础上乘以一个校正因子J,该因子关联样本量。
  3. 当样本量较大时,Hedges校正因子趋近于1,效应几乎不受影响。当样本量较小时,校正因子小于1,效应量被缩小。
  4. Hedges方法适用于样本量不大于20的元分析,可以很好校正小样本偏差。
  5. 但当样本量非常小时,Hedges方法的校正可能不足,仍存在一定偏差。
  6. Hedges方法实现简单,多数元分析软件中均有内置函数。
  7. Hedges校正后的效应量符合正态分布,可用于构建置信区间。

总之,Hedges方法通过对小样本效应量进行校正,可以提供更稳健准确的效应量估计。它应该成为小样本元分析的标准校正方法之一。但对极小样本的校正效果仍有限。

Hunter-Schmidt method(X)

Hunter-Schmidt方法是元分析中校正效应量的一种重要方法,主要用于校正采样误差和测量误差带来的偏差。其主要特点有:

  1. Hunter-Schmidt方法同时校正了采样误差和测量误差导致的效应量偏差。
  2. 采用方差组分分析的思想,将观测方差分解为真实方差、采样方差和测量方差。
  3. 通过估计每一组分的数量,对观测效应量进行统计校正。
  4. 该方法对测量误差的校正需要假定效应量的可靠性,这一假定具有一定主观性。
  5. Hunter-Schmidt方法可以有效校正发表偏倚,提供稳健的效应量估计。
  6. 但其对小样本和异质性样本的校正效果不佳。
  7. 该方法计算较为复杂,需要元分析者对方差分析法有深入了解。
  8. 多数元分析软件可提供Hunter-Schmidt方法的实现。

总体来说,Hunter-Schmidt方法通过校正采样误差和测量误差,能够提供较为准确和稳健的效应量估计。但其计算过程较复杂,且对小样本校正效果有限。需要充分了解其原理后再采用。

Sidik-Jonkman method(X)

Sidik-Jonkman方法是随机效应模型元分析中用于估计方差组分的一种方法。其主要特点包括:

  1. Sidik-Jonkman方法假定真实效应量在研究间是随机变量,符合随机效应模型。
  2. 它通过构建两阶矩方程组,解出研究间方差τ^2和研究内方差σ^2的估计量。
  3. 与DerSimonian-Laird方法类似,Sidik-Jonkman方法也利用研究内和研究间的方差信息进行估计。
  4. 当研究数量较少时,Sidik-Jonkman方法可以提供较为准确和稳健的方差组分估计。
  5. Sidik-Jonkman方法还可以很好地估计τ^2的标准误。
  6. 但当研究数量较大时,Sidik-Jonkman方法的估计准确性下降。
  7. Sidik-Jonkman方法实现较简单,部分元分析软件中已内置该方法。

总结而言,Sidik-Jonkman方法利用矩估计的思想,可以很好地估计随机效应模型的方差组分,尤其适用于研究数量较少的情况。但其对大样本的适用性较差。需要根据具体场景选择使用。

Empirical Bayes method(X)

经验贝叶斯(Empirical Bayes)是一种统计参数估计方法,它结合了样本信息和先验信息来获得参数的后验估计。经验贝叶斯方法在元分析中的主要特点有:

  1. 经验贝叶斯利用全部研究的信息来估计各个研究的效应量,可以减少随机误差。
  2. 它将每个研究的效应量视为来自一个总体分布,并以此为先验构建后验估计。
  3. 经验贝叶斯方法可以有效减少小样本大小和发表偏倚的影响。
  4. 但是,经验贝叶斯方法依赖于一个总体先验分布的假定,该分布形式难以确定。
  5. 如果假定的先验分布与真实分布差异较大,将导致参数估计的偏差。
  6. 经验贝叶斯方法实现较为复杂,需要指定适当的先验分布形态。
  7. 多数统计软件可提供经验贝叶斯模型的实现,但需要正确设置先验分布。

总体来说,经验贝叶斯方法通过借助全部样本信息,可以提供较为准确和稳健的效应量估计。但其对先验分布的依赖性较强,需要谨慎采用。

Paule-Mandel method(X)

Paule-Mandel方法是一种元分析中估计方差的方法,通常用于方差组分的估计和异质性检验。其主要特点包括:

  1. Paule-Mandel方法利用矩估计的思想,以样本方差的函数形式构建估计方程。
  2. 通过求解估计方程,可以直接获得研究间方差τ^2和研究内方差σ^2的估计量。
  3. Paule-Mandel方法的估计量与其他矩估计方法(如DerSimonian-Laird)存在微小差异。
  4. 当研究数量较少时,Paule-Mandel方法能提供较为准确和稳健的方差组分估计。
  5. 与Likelihood Ratio检验相比,Paule-Mandel方法进行异质性检验时存在一定的保守性偏差。
  6. Paule-Mandel方法的计算过程较为简便,多数元分析软件中已集成实现。
  7. 但其对大样本量情况下的表现较为悬殊,估计效果可能会变差。

总体来看,Paule-Mandel方法是一种适用于小样本随机效应模型元分析的方差组分估计方法。它计算简单,具有一定优势,但对大样本情况还需谨慎采用。

residual value

在使用JASP软件进行元分析时,漏斗图(funnel plot)中的残差值(residual value)是基于Hedge’s g计算的标准化残差。

主要原因如下:

  1. JASP中的元分析默认报告效应量是Hedge’s g而不是Cohen’s d。
  2. 漏斗图的残差值是应用标准化方法获得的,即残差除以标准误。
  3. 由于JASP采用的效应量是Hedge’s g,所以残差也是基于Hedge’s g计算得到。
  4. 如果是基于Cohen’s d,则残差值会有细微不同,但两者高度相关。
  5. JASP中无需手动转换,残差值默认就是基于Hedge’s g的标准化残差。
  6. 用户只需注意Interpret残差时应参考Hedge’s g的分布范围,约为[-3,3],来判断数据是否异常。

综上所述,JASP软件中漏斗图的residual value是基于Hedge’s g标准化而来的残差值,用户需要注意这一点,以正确解释残差的含义。这与JASP采用Hedge’s g作为默认效应量指标是一致的。

残差(residual)是回归分析中一个重要的概念。它表示每个观测值与模型预测值之间的差异。残差的主要功能有:

  1. 评估模型的拟合优度:残差越小,表示拟合效果越好。
  2. 发现异常观测值:通过残差的大小可以 判断是否存在异于模型预测的异常点。
  3. 提供诊断信息:残差的分布情况可以判断模型质量和错误指定的形式。
  4. 构建预测区间:利用残差信息可以构建回归模型的预测区间。
  5. 指导模型改进:残差结构提供了模型可以改进的信息。
  6. 计算校正的R平方:利用残差平方和可以计算校正的R平方。

残差的主要类型有:

  • 残差=观测值-预测值
  • 标准化残差=残差/标准误
  • 学生化残差=残差/根均方误差

总之,残差反映了模型未能拟合的部分,其大小和分布具有重要的诊断价值,可以用来评估模型质量,指导模型改进。它在回归建模中起着非常关键的作用。

Hedge’s g与Cohen’s d 的区别

Hedge’s g 是元分析中用于表示效应量的一个常用统计量。它与Cohen’s d类似,也用来反映两组样本均值差异的效应大小。

Hedge’s g与Cohen’s d 的区别主要有:

  1. Hedge’s g 对样本量小于20时的效应量进行了调整,可以提供无偏的效应量估计。而Cohen’s d 在小样本时会高估效应量。
  2. Hedge’s g 在计算时引入了一个调整项J,以对小样本进行校正。当样本量充足时,J趋于1,调整效应不大。
  3. Hedge’s g 调整后的效应量符合正态分布,可用于构建置信区间。Cohen’s d 不可直接用于置信区间构建。
  4. Hedge’s g 的计算公式为:

g = J * (mean1 – mean2) / pooled SD

其中,J = 1 – (3 / (4*(n1+n2) – 9))

  1. Hedge’s g 在绝对值上一般略小于Cohen’s d,它提供了更为稳健和准确的效应量估计。
  2. 多数元分析软件默认会报告Hedge’s g而不是Cohen’s d。

综上,Hedge’s g 通过对小样本进行校正,是推荐的效应量度量,应作为元分析报告结果的首选。它可以很好地控制和补偿小样本量带来的误差。

REML

关于使用REML随机效应元分析研究学习效果的一些经典文献

  1. Hedges和Olkin (1985) 这篇综述系统讨论了各种随机效应元分析模型以及REML方法的优点,奠定了随机效应元分析的理论基础。

Hedges, L. V., & Olkin, I. (1985). Statistical methods for meta-analysis. Academic press.

  1. Raudenbush (1994) 这篇文章探讨了如何将多级模型与随机效应元分析相结合,为后续的元回归分析奠定了基础。

Raudenbush, S. W. (1994). Random effects models. The handbook of research synthesis, 301-321.

  1. Overton (1998) 这篇教育心理学领域的文章采用了REML进行学习策略对学习效果的随机效应元分析。

Overton, R. C. (1998). A comparison of fixed-effects and mixed (random-effects) models for meta-analysis tests of moderator variable effects. Psychological methods, 3(3), 354.

  1. Van den Noortgate等 (2013) 这篇文章全面比较和评估了不同的随机效应元分析方法,包括REML,为方法选择提供了指导。

Van den Noortgate, W., López-López, J. A., Marín-Martínez, F., & Sánchez-Meca, J. (2013). Three-level meta-analysis of dependent effect sizes. Behavior research methods, 45(2), 576-594.

要实现与CMA软件中MEA等效的元分析,应该选择哪个随机效应模型:

在JASP的元分析界面,随机效应模型对应的选择是:

“Analysis”下拉菜单中选择“Meta-Analysis”

然后在“Method”项中,选择“Random Effects”中的“Restricted Maximum Likelihood”。
然后在“Method”项中,选择“Random Effects”中的“Restricted Maximum Likelihood”。

也就是选择“Restricted Maximum Likelihood”这一项。

选择这个模型的理由:

  1. 它与DerSimonian-Laird方法等效,可以估计研究间异质性。
  2. JASP文档也建议它对研究间异质性的估计更优。 JASP文
  3. 它会自动估计两个方差组分,但我们可以只关注研究间的一项。
  4. 该方法与CMA的MEA估计方程一致。
  5. 研究也证实了两者等效。

所以,在JASP中进行与CMA软件MEA相当的元分析,选择“Restricted Maximum Likelihood”模型是最合适的。

评论 抢沙发

登录

找回密码

注册