Python划分数据集,python训练数据集怎么做
这里假设类标签为大剂量,小剂量,不一样三类,假设训练样本有三个特征属性,类标签放在数据集的最后一列
将数组作为npdef文件2矩阵(文件名)导入:#文件名是文件保存地址love _ dictionary={ large doges :3, small doges :2, didnt like :1 } fr=open(filename)array lines=fr。readlines()行数=len(array olines)#获得文件的行数返回mat=NP。零((行数,3)) #用于存放训练数据classLabelVector=[] #用于存放类标签arrayOLines中线条的index=0:line=line。strip()#截取掉所有的回车字符list from line=line。split()return mat[index,]=listFromLine[0:3] #存放训练样本if(listFromLine[-1]).isdigit()): #如果标签字符串是数字,用int()函数转换为数字类型classlabelvector。append(int(list from line[-1]))else:#如果标签字符串不是数字,利用字典转换为数字类型classLabelVector。追加(爱_字典。get(list from line[-1]))index=1 return return mat,classLabelVector isdigit()判断一个字符串是否为数字
b=[a , 2a , 2]print(b[0].isdigit())print(b[1].isdigit())print(b[2].isdigit())FalseFalseTrue
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。