python中tuple函数用法,python tuples
I:Z check # data:price _ earnings _ ratio利率importpandasasportnumpyasnpimportstatsmodels . stats . weightstatsasswz _ mean=data average:),Z _ mean)Z _ STD=data( price _ earning _ ratio)。fillna)) 0)。Price _ earning 652=16 # value=15,alternative=" Accept H0 "(else:print)z _ result[1],Accept H1 (II:T-test # data:price _ book _ ratio账面利率#配对样本T-test ImportPandasapNumpyasNPImportScipy。StatsasstSTDATATION。dropna(data 3=data . dropna(*(NP . rand . rand))单样本T检验ST.ttest_1samp) data2,2.45) TTest _ 1SAMP结果)Statistical=0.1225 p value=0.8997743929641389)配对样本T检验ST.ttest_rel(data2,3) ttete pvalue=0.0) #独立抽样T检验#1。方差匹配ST.ttest_ind(data2,data3,Equal _ var=true(# ttest _ ind result)statistical=sticpvalue=8.654411469975374 e-228(2 .方差不一致性ST.ttest_ind(data2,data3,Equal _ var=false)ttest _ ind result))pvalue=1.2857174411427583 e-48)三:f检验的简单过程是先利用熊猫库的数据帧数据结构构造输入数据格式,
然后利用statsmodels库的ols函数得到最薄炮的线性回归模型。
最后使用statsmodels库中的anova_lm函数进行方差分析。
数据前提:需要独立数据/分布式检查。
3.1方差齐性检验#来自scipy的方差齐性检验. statsimportletlevelnex=[-4,-3,-2,-1,0,1,2,3,4] y=[-10,-5,-2,-3,0) print (p (f _ val) print) 3.2f验证importpandasasportnumpyasnpfromstats models . formula . apimportolsfromstatttmentm _ type , size_type ,Price _ income _ ratio ]。dropna (#投资类型,投资规模,利率数据5 . rename)columns={ } in place=true(#因子A水平对结果的影响(value~c(a)) #因子A和因子B水平对结果的影响(value~c) A) c))因子A和因子B以及A和B的交互水平对结果的影响。model=ols(value~c(a) c) b)和data=data5([a , b , value])()。适合()
单一样本:适用性检查确定分类变量是随机的还是符合指定的概率。
两个独立样本:交叉表,即判断两个分类变量之间的相关性。
两组配对样本:配对卡片
4.1单一样品importpandasaspdimportnumpyasnpfromshipimportstats # 1。单样本#矩阵数据集# H0:变量出现的概率相同#准备数据(data_test1=PD.dataframe)数据={实际频率:(15,20,11,35,22),期望频率3360 (20,20,20, 20)20)} index=list(abcde))print)data _ test1)卡方值data_test1[差异]=) data_test1[实际频率]-data 2 print(data _ test1)KF _ value=(data _ test1[差异平方]/data_test1[预期频率])))卡方值SSE ArrayOfVersedCountSF _ EXP=data _ test1["预期频率" #预期国家数组#结果:power _ divergence结果(中P _ value=1-stats . chi 2 . CDF(x=KF _ value)DF=4)Print(P _ value)(Print)P _ value)结果:0.007586791035 4.2跨列内联#2。跨列Inline #用于两个分类变量的相关性分析H0:【性别和专家之间没有明显的相关性。importadaaspdimportnumpyasnpfromchiimportstatsdata _ test2=PD . data frame(data frame)32), python: [50,42], PHP: [55,20](print(data _ test2)d=data _ test2[[ Java ,])第三个值是自由度,第四个值是对应的理论值,与原始数据排列的维数相同# Results: # 3.2224365,# 0
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。