一文解析临床研究中的偏倚及控制方法
在临床科研过程中,我们都致力于一点,就是让分析所得的关联性(association)尽量接近病因性(causation)。除了应用统计学方法以外,非常重要的就是从根本上分析造成偏倚(bias)的原因并控制误差和偏倚。正如LinkLab前文所提及的,我们需要重点分析和排除的误差包括:随机误差和系统误差(bias),以及发现和解释效应修正(effect modification)。其中随机误差是随机分布且不可预测的,因此除了增加样本量或重复测量取均值外别无他法。但对于系统误差和效应修正却可以得到控制或解释,帮助理解所得结论。
系统误差包括:混淆偏倚(confounding)、选择偏倚(selection bias)和信息偏倚(information bias)。其中,信息偏倚(information bias)是指在研究的实施阶段中从研究对象获取研究所需的信息时产生的系统误差,其原因是由于诊断疾病、测量暴露或结局的方法有问题,导致被比较各组间收集的信息有差异而引入的误差。本文将不对其进行描述。
阅读此文前强烈建议您阅读LinkLab 2015年11月6日《流行病学也好玩(四):一种方法教会你理清科研思路》,之后就能轻松理解清楚误差和偏倚,以及有效的解决方法。
混淆偏倚(confounding)
E:暴露变量(exposure);
Y:结果变量(e);
C:混淆因素
在研究暴露与疾病的联系时,C作为混淆因素(confounder)必须满足:
1)与exposure相关联;
2)e相关联且不是因为exposure;
3)不在E和Y的因果链上。
但并不是满足这三个条件就是混淆因素。由于混杂变量的存在,造成了观察到的联系强度偏离了实际情况,则称为混杂偏倚。
小测试:
假设A=exposure,Y=e,哪些图的L不是混淆因素呢?
答案就是最后一个图。
混淆因素严重干扰我们对于risk的估计,所以必须想办法控制这些variable。但是有时候因为我们需要考虑的混淆因素不可测量,为了能够分析出真实的结果,可以使用surrogate confounder来控制混淆因素。
如下图:
U为不可测量的混淆因素,为了控制U,我们可以替代使用能够代表U的其他变量L来分析。比如,我们需要考虑社会地位这个因素,因为无法测量社会地位,所以我们可以使用教育、收入、住址、学历等因素代表社会地位进行分析。
切忌:当进行统计分析的时候,务必仅考虑混淆因素而不对非混淆因素进行处理,所以并不是考虑的因素越多越好。因为分析时控制的混淆因素越多,则分析的power越低,甚至因为控制某一非混淆因素而引入新的混淆因素。如下图:
本身该DAG不存在混淆因素,但是如果误把L当成了混淆因素对其进行控制时,U1,U2则变成了混淆因素对A与Y的相关性产生干扰。
如何去除混淆因素对分析结果的影响呢?
在试验设计阶段,我们可以采取:
1)随机化(randomization):可以有效控制已知和未知的confounders;
2)匹配(matching)和限制(restriction):可以控制已知的confounders;
限制:如果认为某个或某些因素是可能的或已知的混杂因素,在设计过程中,可对研究对象的选择条件进行规定,但限制条件不
一文解析临床研究中的偏倚和控制方法 来自淘豆网m.daumloan.com转载请标明出处.