证据中国

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 视频教程
查看: 1263|回复: 2

cox回归完了,现在我们讲讲logistics回归。包括单因素与多因素logistics回归

[复制链接]

17

主题

30

帖子

96

积分

注册会员

Rank: 2

积分
96
发表于 2017-11-1 03:20:16 | 显示全部楼层 |阅读模式
讲在前面:其实logistics回归与cox回归有非常多的相似之处,其主要表现在最终结论表格解读,与spss设置一步一步的输入过程中。cox回归最终关心的是生存时间(是连续变量如时间可细分为分钟,秒,毫秒等等无限细分下去),而logistics回归关心的是分类变量(例如是否有淋巴结转移是或否,一般用1或0表示)那么问题就简单了,单因素回归与多因素回归都是一样的,具体详细操作可以见前面的cox回归分析。http://www.evidencechina.com/for ... p;tid=14&extra=好了现在有这么一个数据
搜狗截图17年11月01日0232_1_副本.png

黑圈都是连续变量,红的为分类变量,本身logistics回归是可以同时处理分类与连续混合在一起的,但是很多时候为了数据好看,我们都把连续变量都分类了,比如年龄这里就分为大于50的标记为1,小于50的标记为0等等,在这里就不分了。
使用Logistic模型前,研究者需判断是否满足以下七个研究假设:
•        假设1:因变量即结局是二分类变量。
•        假设2:有至少1个自变量(就是你想观测的结果,就是这里的心脏病发病),自变量可以是连续变量,也可以是分类变量(最好是分类变量)。
•        假设3:每条观测间相互独立。分类变量(包括因变量和自变量)的分类必须全面且每一个分类间互斥。
•        假设4:最小样本量要求为自变量数目的15倍,也有一些研究者认为样本量应达到自变量数目的50倍
•        假设5:连续的自变量与因变量的logit转换值之间存在线性关系。
•        假设6:自变量间不存在共线性。
•        假设7:没有明显的离群点、杠杆点和强影响点。
假设4-6其实很多时候达不到,在低分杂志中,本身审稿人就是不怎么懂数学,所以你这个不许要太在意吧,如果你要是真正的临床研究,为了真理,请你忽略我这里说的。
三、对假设的判断
假设1-4:取决于研究设计和数据类型,如果不满足则需要更换统计方法。
后3个假设则依赖于二分类Logistic回归是否适用于数据。
假设5: 连续的自变量与因变量的对数间存在线性关系。
在本例中,要求连续的自变量即年龄(age)、体重(weight)、最大摄氧量(VO2max)与因变量即心脏病的logit转换值之间存在线性关系。可以通过多种方法检验该线性关系,例如,用logitP和自变量画散点图,看是否存在线性关系;也可以通过Box-Tidwell方法,即将连续自变量与它们的自然对数值的交互作用项纳入回归方程中。
本文通过Box-Tidwell方法,发现所有连续自变量与因变量logit转换值之间存在线性关系。因为Box-Tidwell方法太过复杂,这里就不再详细介绍,有想详细了解的,可以和小咖(微信:xys2016ykf)联系,小咖把详细步骤发给你~。
如果一个及以上连续自变量与因变量的logit转换值间不存在线性关系,可以对其进行数据转换以满足线性假设,需注意以下几点:
1) 数据转换针对原始的连续自变量,如年龄(age)。
2) 只需转换不满足线性假设的连续自变量,不需要转换满足假设的连续变量和不需要线性假设的分类自变量。
3) 如果可以进行数据转换,需要重新检验是否存在线性关系。
如果采用以上方法仍不满足线性假设,则需要将该变量转换为有序分类变量。
假设6:自变量间不存在共线性。
假设7:没有明显的离群点、杠杆点和强影响点。
1. 该假设的SPSS操作可见后面第四大部分的操作,此处仅展示如何解读结果。结果中Casewise List表格显示学生化残差大于±2倍标准差的观测。学生化残差大于2.5倍标准差的观测,需要研究者进一步观察决定这些观测是否是离群点,如有必要甚至可以从分析中剔除这些观测。Casewise Diagnostics表格中展示这些信息,如下图:

搜狗截图17年11月01日0253_2.png

注意1:如果所有观测的学生化残差小于±2倍标准差,SPSS不会输出上表。如果已经剔除离群点,则第一次分析得到的Casewise Diagnostics表格不会再显示。
注意2:可以通过各种残差如标准化残差、学生化残差或者学生化删除残差来检查离群点。在SPSS操作中勾选Casewise diagnostics选项时,SPSS默认使用学生化残差。
本例中,第70个观测(Case Number)的学生化残差为3.349,符合上述判断离群点的标准,如下图中红框显示:


注意:观测数(Case Number)指SPSS系统内自动编码(Data View窗口中最左侧蓝色一列中的编码),而非研究者赋值的编码。

研究者需要查看该观测为离群点的原因,决定是否删除该观测并报告。本例中则报告“纳入分析的观测中有一项观测学生化残差为3.349”。

根据SPSS分析结果,有两种情况:①如果没有离群点,则直接进入第五部分结果解读;②如果有离群点,研究者决定是否剔除这些观测或者对数据进行转换。如果剔除离群点,则需要对剔除后的数据重新进行回归分析。如果进行数据转换,则需要从线性假设重新开始分析
这里给一个网址,反正我是看不懂,我也没有去请教,应该在北大经济学论坛数学专栏中有这个统计的达人,所以我就不在这里说了,因为我整个百度搜索下来都没有关于共线性诊断的东西,你会不会也没关系,因为医学需要这么高深的数学吗?显然不需要啊
http://www.bubuko.com/infodetail-1598937.html

搜狗截图17年10月28日2123_4_副本.png
这里选1,因为本身结局变量就是二分类,yes/no所以选择这个。如果结局变量是多分类,则选下面那个箭头。记住logistics回归就是与cox回归非常接近,你可以看我的视频,也可以看明白cox回归,然后都一样,

搜狗截图17年11月01日0301_4.png
搜狗截图17年11月01日0302_5.png
然后continue
结果
二分类Logistic回归分析的结果有两个目的:①观察自变量对因变量的影响是否有统计学意义;②观察二分类Logistic回归模型预测因变量的效果。这两个目的可以通过下面的各部分结果反映。
1. Data coding(数据编码):检查变量和数据,包括以下3步。
(1) 检查是否存在缺失观测,纳入分析的观测数是否符合数据库中观测数一致。Case Processing Summary表格如下图:
搜狗截图17年11月01日0307_6.png
搜狗截图17年11月01日0307_7.png
搜狗截图17年11月01日0307_8.png
搜狗截图17年11月01日0308_9.png
搜狗截图17年11月01日0308_10.png
搜狗截图17年11月01日0308_11.png
搜狗截图17年11月01日0308_12.png








搜狗截图17年11月01日0254_3.png
回复

使用道具 举报

17

主题

30

帖子

96

积分

注册会员

Rank: 2

积分
96
 楼主| 发表于 2017-11-1 03:33:37 | 显示全部楼层
也并非原创,都是学习嘛,有视频,详细解答
回复

使用道具 举报

0

主题

3

帖子

409

积分

中级会员

Rank: 3Rank: 3

积分
409
发表于 2017-11-4 13:01:29 | 显示全部楼层
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Evidencechina Inc.

GMT+8, 2018-10-16 22:14 , Processed in 0.139732 second(s), 23 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表