orange手机平台,orange 数据
橙色3用途
1.Orange3数据挖掘工具介绍
官方网站:https://orange.biolab.si/
正如主页介绍的那样:它是一款面向新手和专家的开源机器学习和数据可视化工具,拥有许多针对数据挖掘或机器学习模型的交互式数据分析工作流;此外,它还绑定了Python语言进行脚本开发。它包含了数据挖掘过程的一系列组成部分,如数据预处理、建模、模型评估和可视化。
数据预处理主要包括:数据合并(将两个不同数据集的指定特征合并到同一个数据集);数据采样、数据离群点剔除、相关性检验(协方差)、秩和置乱等。
模型主要有:CN2规则归纳、K近邻、决策树、随机森林、支持向量机、线性回归、logistic回归、朴素贝叶斯、adaboost、神经网络、随机梯度下降等。
无监督模型包括距离矩阵、t-SNE、层次聚类、K-means、louvain聚类、PCA、MDS等。
此外,还支持文本分析、词云可视化等。
评价模型主要有:交叉检验、混淆矩阵、ROC曲线、lift曲线等。
二、橘子入门
1.官网下载Orange最新版本并安装(没有其他复杂操作,直接进入下一步,想修改安装位置可以自定义)
说明:Orange自带最新或最新版本的Python环境。对于复杂的数据集,如果Orange自带不方便处理的组件,通常文件数据会先连接Python脚本,再由Python处理后转换成Orange。Tabel()表单进行后续操作。用Python处理的具体方法和代码请参考官方文档:
http://docs . orange . biolab . si/3/data-mining-library/tutorial/data . html
此外,本文档还包括一系列使用Python(Orange)进行数据挖掘的编程教程。想要深入了解和掌握Orange Python进行数据挖掘,需要花时间仔细阅读和接触,这里就不赘述了。【当然,如果你已经安装了Python版本3以上,也可以直接pip安装Orange3,使用Python shell进行编程(前提是你熟悉Orange的数据结构和相关函数)。官方文件:http://docs.orange.biolab.si/3/data-mining-library/#tutorial]
2.2的使用。橙色软件
准备工作:
(1)添加附加组件:您需要在选项中找到附加组件。
点击后,会弹出下图所示的窗口,
其中,滤镜条是Orange自带的组件的一部分(勾选的话是下载的,可以根据需要自己下载);如果要安装其他组件,可以点击下图所示的添加更多,输入包名下载【类似Python pycharm添加Python包的步骤】
(2)对于Orange的简单操作,官方文档:https://orange.biolab.si/getting-started/给出了一些数据挖掘分析的例子。详细内容,打开Orange3软件后,会弹出下图所示的面板,点击示例。
3.详细描述
如上图所示,SQL表是一个连接数据库的组件,但是对于第一次安装Orange的用户来说,点击它之后,右栏的图标会出现一个红色的三角符号,点击它会提示错误。请安装一个后端来使用这个widget,也就是缺少SQL的编译器[Orange只支持PostgreSQL和SQL Server数据库]
这里重点介绍Orange连接PostgreSQL数据库的操作:
(1)首先需要下载PostgreSQL的配置文件psycopg2。
以下是解决方案,https://blog . biolab . si/2018/02/16/how-to-enable-SQL-widget-in-orange/
这里是Python3.6版本3.6,或者你可以去https://pypi.org/搜索Psycho PG 2找到相应的版本下载。
MacOS下载
https://pypi . python . org/packages/8c/a5/0 e 61 D6 F4 a 140 a6 e 06 a9 ba 40266 C4 b 49123d 834 f1 f 97 Fe 9 a E0 b 6 e 45112 b/psycopg 2-2 . 7 . 4-cp36-cp36m-ma cosx _ 10 _ 6 _ Intel . ma cosx _ 10 _ 9 _ Intel . ma cosx _ 10 _ 9 _ x86 _ 64 . ma cosx _ 10 _ 10 _ Intel
windows:3359 pypi . python . org/packages/F9/F9/77/e29b 792740 ddec 37 a2 d 49431 EFA 6 c 707 cf 3869 c 0 cc 7 f 28 c 7411 bb 6 e 96d 91/psycho G2-2 . 7 . 4-cp36-cp36m-win _
下载:Linux:https://pypi . python . org/packages/92/15/92 b5 c 363243376 ce 9 CB 879 bbec 561 BBA 196694 EB 663 a 6937 B4 CB 967 e 230 e/psycho G2-2 . 7 . 4-cp36-cp36m-many
(2)下载后,打开上面的插件,拖动。whl文件添加到组件栏,您将看到已经安装了Psycopg。此时,由于尚未安装PostGreSQL数据库,SQL小部件仍然无法使用。
下载地址是https://www.postgresql.org/.下载相应系统的版本并安装。安装过程类似于MySQL,所以需要编辑用户名和密码(记住)。另外,最新版本的Navicate Premium可以作为PostgreSQL的界面管理工具。另外,PostgreSQL是一个强大的开源数据库。更多信息,请参考http://www.postgresqltutorial.com/,或搜索相关博客。
相反,如果你只想把它作为连接Orange的插件,可以直接把MySQL数据库中的表拖拽复制到Navicate Premium中的PostgreSQL数据库中。
【注意:将不属于PostgreSQL的数据库文件直接导入到PostgreSQL会出错(例如:错误:无法识别的配置参数 foreign _ key _ checks ,时间:0.0,因为不同的数据库存储数据的格式和结构不同)】
如下图所示,
然后选择复制到这里(结构和数据),弹出下图(右)所示界面,点击下一步。
当然,也可以用同样的方法将PostgreSQL中的表复制到MySQL中。
至此,准备工作基本完成。
对于每个组件的使用,请参考官方文件http://docs.biolab.si/3/visual-programming/index.html.也
单击工具后,单击“?”没有,如下图所示
以下是Python脚本在整个项目中的大概位置。
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。