7 二元 logistic 回归
7.1 导读
线性回归的因变量 Y 必须为连续变量,但当我们研究的因变量为分类变量时,因为不
再是随机变量,不符合正态分布,因此不能采用线性回归,此时应该使用 Logistic 回归。
Logistic 回归分析也用于研究变量之间的影响关系,即 X 对 Y 的影响情况,此处涉及的
Y 是分类数据。结合 Y 的具体情况,Logistic 回归分析可以分为三种,分别是二元 Logistic
回归、多元无序 Logistic 回归和多元有序 Logistic 回归。Logistic 回归分析的分类情况如下
图:
如果因变量 Y 仅有两个类别,分别是有无之类的分类数据,则属于二元 Logistic 回归分
析。如果因变量 Y 有两个以上的类别,并且类别之间没有高低、顺序关系,比如血型“A 型、B
型、AB 型和 O 型” ,则可以使用多元无序 Logistic 回归分析。如果因变量 Y 的类别有两个
以上的类别,并且类别之间有高低、顺序关系,如伤痛级别“轻度、中度、重度”,则可以使
用多元有序 Logistic 回归分析
问卷研究中,二元 Logistic 回归使用频率最高,该方法简单易懂,多元无序 Logistic 回
归和多元有序 Logistic 回归则相对复杂。本次仅对二元 Logistic 回归进行说明。
温馨提示:
在进行二元 Logistic 回归( 包括其他 Logistic 回归)分析前,建议先通过单因素分析(t
检验、卡方检验等)考察所有自变量与因变量之间的关系,筛掉一些可能无意义的变量,再
进行多因素分析,这样可以保证结果更加可靠。同时为了防止一些有意义的自变量被单因素分
析剔除,单因素分析时将检验水准设为 P<0.01 ,只要小于 0.01,就认为有意义,然后进行多因
素分析。
7.2 操作步骤
问题:性别、学历、独生子女对去新疆就业意愿的影响?
性别:1=男,2=女;
学历:1=研究生,2=本科生;
独生子女:1=是,2=否;
评论0