python线性回归函数,线性回归设置哑变量
标题:
分类变量变成哑变量后如何进行多元线性回归?
我需要分析的因变量是连续数值变量,自变量包括连续数值变量、二元变量和转换后的哑变量。软件是SPSS,具体操作不知道怎么做。
回答:
好吧,分类变量包括二元变量和多分类变量,其中二元变量变成哑变量,只要一类赋0,另一类赋1,以0为对照组;如果是多类别变量,在改成哑变量时,需要设置一个类别数减1的哑变量。例如,如果等级有三个值:一级、二级、三级,则需要设置两个哑变量:一级和二级,一级和二级都为0,表示一级、二级为0、二级为0、一级为0、二级为1。
输入数据时,数据中有两个变量:一级和二级。两个变量的值都是0和1,做回归分析的时候把这两个变量选进自变量就可以了。(这些其实在logistic回归中是一步完成的,但是在线性回归中按照上面的就麻烦了。)不知道有没有说清楚。
再次:谢谢!上面那段我看懂了,但是在SPSS的多元回归中怎么操作呢?例如,等级(G)转换为G1和G2,城市(C)转换为C1、C2和C3,并添加连续数值变量M、N和二元变量P、Q。在这种情况下,这些自变量是否一次性选入自变量,按照enter的方法进行分析?分配完下一步操作还是很迷茫。
再次回答:可以,是一次性选入自变量,但最好选择逐步法,因为这么多变量之间可能有很高的相关性。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。