陈老师SPSS论坛

标题: 求助!陈老师您好,请问方差分析,如何排除,种族,年龄,和BMI的干扰?急! [打印本页]

作者: Mia666    时间: 2018-8-15 01:49
标题: 求助!陈老师您好,请问方差分析,如何排除,种族,年龄,和BMI的干扰?急!
两组临床病人400个,分为对照组(未患病)300个和糖尿病组(患病组)100个,收集临床病人血清进行代谢组学检测,每个病人检测了100多个代谢物,想通过方差分析,找到在两组间有显著差异表达的代谢物,直接进行T-test得到的结果不能排除一些临床因素带来的影响,现在想排除种族(黑,白,西班牙,亚洲,四分类),年龄,和BMI因素的影响,得到只因患病这个因素引起的差异表达的代谢物,请问陈老师应该使用什么样的检测?
问题1:种族为分类变量,不能使用一般线性模型将其纳入协方差,那么如何排除种族带来的混杂因素?
问题2:是否应该使用回归?应该使用哪种回归?若使用回归,还是应该将对照组与患病组作为因变量吗?可是这样的话,是否分析就变成了各种因素对是否患病的影响(类似于预测),而不是寻找患病组vs对照组的差异?
问题3:在做方差分析时,代谢物的数值需要经过log转换使其符合正态分布,如果使用回归分析,原始数值还需要经过log转换吗?
问题4:因为代谢物有100多个,如果使用回归,是否能够批量进行检验?而不是一个一个进行操作?
非常感谢


作者: 陈老师    时间: 2018-8-24 18:25
排除性别、年龄、种族、BMI等因素造成的混杂干扰,单因素方差分析是无法实现的,排除混杂干扰应该选择的统计学方法是[display]线性回归分析,因为因变量是代谢物,属于连续数值型变量,所以必须选择线性回归,将性别、年龄、种族、BMI等因素作为自变量纳入回归模型即可。种族作为分类变量,在进行线性回归分析的时候需要进行虚拟化处理之后,再作为自变量纳入回归模型。
单因素方差分析要求变量必须服从正态分布。
可以进行批量检验,直接把这100多个变量选择进正态性检验的窗口即可。




欢迎光临 陈老师SPSS论坛 (http://cl850818.w150.mc-test.com/) Powered by Discuz! X3.2