两组临床病人400个,分为对照组(未患病)300个和糖尿病组(患病组)100个,收集临床病人血清进行代谢组学检测,每个病人检测了100多个代谢物,想通过方差分析,找到在两组间有显著差异表达的代谢物,直接进行T-test得到的结果不能排除一些临床因素带来的影响,现在想排除种族(黑,白,西班牙,亚洲,四分类),年龄,和BMI因素的影响,得到只因患病这个因素引起的差异表达的代谢物,请问陈老师应该使用什么样的检测? 问题1:种族为分类变量,不能使用一般线性模型将其纳入协方差,那么如何排除种族带来的混杂因素? 问题2:是否应该使用回归?应该使用哪种回归?若使用回归,还是应该将对照组与患病组作为因变量吗?可是这样的话,是否分析就变成了各种因素对是否患病的影响(类似于预测),而不是寻找患病组vs对照组的差异? 问题3:在做方差分析时,代谢物的数值需要经过log转换使其符合正态分布,如果使用回归分析,原始数值还需要经过log转换吗? 问题4:因为代谢物有100多个,如果使用回归,是否能够批量进行检验?而不是一个一个进行操作? 非常感谢 |
欢迎光临 陈老师SPSS论坛 (http://cl850818.w150.mc-test.com/) | Powered by Discuz! X3.2 |