python读取数据文件,python读写csv文件方法总结
这篇文章主要介绍了大蟒取读战斗支援车文件做密度聚类分析,读取战斗支援车文件中相应的列,然后进行转化,处理为本算法需要的格式,然后进行密度聚类运算,下面文章的具体介绍需要的小伙伴可以参考一下
目录
1.读取战斗支援车数据做密度聚类分析2.输出结果显示3.计算效率
1.读取csv数据做dbscan分析
读取战斗支援车文件中相应的列,然后进行转化,处理为本算法需要的格式,然后进行密度聚类运算,目前公开的代码也比较多,本文根据公开代码修改,
具体代码如下:
从实例导入数据集
将数组作为铭牌导入
随机导入
将matplotlib.pyplot作为血小板计数导入
导入时间
导入副本
进口熊猫作为螺纹中径
#来自sklearn.datasets导入负载_虹膜
def find_neighbor(j,x,eps):
N=列表()
对于范围(x.shape[0]):内的英语字母表中第九个字母
temp=NP。sqrt(NP。sum(NP。平方(x[j]-x[I]))#计算欧式距离
如果温度=eps:
不知道。追加(一)
返回集合(名词)
def DBSCAN(X,eps,min_Pts):
k=-1
neighbor_list=[] #用来保存每个数据的邻域
omega_list=[] #核心对象集合
gama=set([X for X in range(len(X))])#初始时将所有点标记为未访问
cluster=[-1 for _ in range(len(X))]#聚类
对于范围内的:
neighbor _ list。append(find _ neighbor(I,X,eps))
if len(neighbor _ list[-1])=min _ pts :
omega_list.append(i) #将样本加入核心对象集合
omega_list=set(omega_list) #转化为集合便于操作
而len(omega_list) 0:
gama_old=copy.deepcopy(gama)
j=随机。choice(list(omega _ list))#随机选取一个核心对象
k=k 1
Q=list()
问。追加(j)
伽玛移除(j)
而临(Q) 0:
q=Q[0]
问。删除(问)
if len(neighbor _ list[q])=min _ pts :
delta=邻居列表伽马
deltalist=list(delta)
对于范围内的:
Q.append(deltalist[i])
伽马=伽马-德尔塔
Ck=伽马_旧伽马
Cklist=list(Ck)
对于范围内的我(伦(Ck)):
cluster[Cklist[i]]=k
omega_list=omega_list - Ck
返回群集
# X=load_iris().数据
data=pd.read_csv(testdata.csv )
x,y=数据[时间(秒)],数据[高度(米海)]
打印(类型(十))
n=len(x)
x=np.array(x)
x=x . shape(n,1)
y=np.array(y)
y=y . shape(n,1)
X=np.hstack((x,y))
cluster_std=[[.1]],random_state=9)
每股收益=0.08
min_Pts=5
begin=time.time()
C=DBSCAN(X,eps,min_Pts)
end=time.time()
图表()
plt.scatter(X[:0],X[:1],c=C)
plt.show()
2.输出结果显示
修改参数显示:
每股收益=0.8
min_Pts=5
3.计算效率
采用少量数据计算的时候效率问题不明显,随着数据量增大,计算效率问题就变得尤为明显,难以满足大量数据的计算需求了,后期将想办法优化计算方法或者收集英语字母表中第三个字母代码进行优化了。
到此这篇关于大蟒取读战斗支援车文件做密度聚类分析的文章就介绍到这了,更多相关Python dbscan分析内容请搜索盛行信息技术软件开发工作室以前的文章或继续浏览下面的相关文章希望大家以后多多支持盛行信息技术软件开发工作室!
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。