再谈“匹配”,组会聊天纪要

  今天又是周五,上午科室组会,包络分析(DEA)。讲完后,大家都意犹未尽,于是便就着咖啡,聊起了问题。其中有一个问题便是“在病例-对照研究中,病例与对照之间是匹配好,还是不匹配好?”

  提到这个问题,我就想起被人问过无数次的过往,经常会有人会问我这个问题:“我有2000多研究对象的数据,但是这2000人里只有100个患者,你说我是挑出100个对照呢,还是把剩下的1900名研究对象都作为对照呢?”

  今天上午的讨论便是针对这个问题。现在回想起这个讨论,场面真是啊,最后大家还是像往常一样“不欢而散”。幸好“主播”因公外出,不在现场,不然不得打起来啊……

  1、对照组的选择是有标准的,即我们常说的入选和排除标准。对照的选择与匹配是两个概念,切不可将“成组匹配”泛化成“对照的选择”。

  2、匹配有“成组匹配”和“个体匹配”。成组匹配(又称频数匹配),就是要求对照组与实验组某些特征的频数相似(如性别比例等),分析时采用样本的检验,如样本t检验等。个体匹配,是针对试验组的每一个研究对象,为其找到合适的对照,分析时采用配对样本的检验,如配对t或条件logistic回归。

  4、匹配有好处,也有坏处。匹配的好处是提高了试验组和对照组的可比性,即内部真实性;匹配的坏处是降低了对照组的代表性,毕竟你删去了一些对照组人群,即外部真实性。有人提出“这种删除导致的外部真实性的损失是对的”,就该放弃不合适的人群。也有人提出“现实中收集到的患者特征,多少代表了真实世界的情况”,不应该剔除。

  5、有人提出:“在探索性研究中,不要使用匹配,给研究者留下探索各种可能的机会;在验证性研究中,可以使用匹配,让待验证的效应更为明确”。也有人提出:“探索性研究才应该匹配,这样才能让微弱的待探索效应更为强烈,容易被发现。验证性研究不该匹配,探索真正的存在于真实世界里的效应大小。(当然这要求所选的样本能够很好地代表总体)”

  6、匹配的方法有针对单个或多个变量的逐个匹配,也有计算中间变量的匹配(如倾向性评分等)。,不可过度匹配。

  7、匹配,还是不匹配?性分析很重要。对于研究者来说,发现真实的规律,永远是最大的梦想。所以针对匹配的数据可以计算一个结果,针对不匹配的数据也可以计算一个结果,比一比,找不同。当然你还可以针对不同匹配方法的结果进行比较。

  最后再回来,对于的例子,我个人不用匹配,直接做分析。对于匹配的问题,大家也可能会有不同的观点,欢迎讨论。

手机正文底部

您可以还会对下面的文章感兴趣:

  • 科学家发明细胞高速识别技术
  • 助人体吸收铁 新研究找到大肠杆菌“益处”
  • 研究称喝酒无论多少都对健康有害
  • 抽血可提前5年预测肾癌
  • 5-HT系统介导肝脏2型糖尿病相关的病理改变
  • 最新评论