生物信息学用python还是r语言,数据分析学Python还是R语言
信息分析对计算机的开发环境有很多要求,自然导致很多麻烦别的不说,平衡Python和R是一件很头疼的事情,在想到用Python处理文本和分析结果的同时,也想到用R做统计分析和绘图,而且很多时候字母生成分析都要在服务器上完成
你用Pycharm做Python,R用Rstudio,还要设置一个服务器连接(如果Pycharm不是付费版本,连接服务器还是挺麻烦的)最后在Windows下,你要打开命令行用Xshell server执行脚本和Shell命令;下载文件并打开一个Filezila;用Excel查看数据表结果;使用PDF Adobe Reader.有人会说,没有这种麻烦可以用Vscode和插件解决~确实是个不错的选择,但是换个电脑之前的环境就全毁了
有了JupyterLab,只要你能连接服务器,所有这些功能都可以在一个窗口完美实现,你需要的只是一个浏览器(最好是Chrome)
看效果:
同时开启Python笔记本、CSV数据表、PDF文献、命令行、文件管理
降价文件预览和图片预览
惊艳(感觉两张截图还是不足以体现JupyterLab * _ *)的强大不仅可以直接查看分析中常用的多种数据和文件格式,Jupyter的笔记本运行后会立即返回结果,非常方便数据分析和可视化我用Atom Moba xterm Filzila的组合写代码,做分析自从不久前尝试了JupyterLab之后,我逐渐抛弃了“dsb”,投入到JupyterLab的怀抱中
安利完了,我们就进入正题,从零开始,构建一个以JupyterLab为核心的生物信息学分析环境特别适合各种服务器和云,当然也可以在本地电脑上使用
设置环境:
硬件:健康的BMW服务器
操作系统:LTS Ubuntu 18.04
* * *本段可以跳过,不影响后面的阅读* * *
注:这里选择Ubuntu系统是因为个人习惯在安装软件和各种环境的时候,apt非常方便,默认仓库的软件版本比较新,解决一些问题很容易其他常见的类Unix系统,如CentOS(也是Linux内核),或苹果的MacOS,在构建Bioconda JupyterLab时并没有太大的不同在安装Bioconda和一些依赖包的时候无非是一样的此外,使用Bioconda,几乎所有用于信息分析的软件和软件包都可以通过Bioconda安装这是一份官方名单:
https://anaconda.org/bioconda/repo?页面=1
如果你用的是Windows,安装Bioconda和Jupyterlab就没有大问题安装各种信息分析软件可能会遇到一些麻烦现在随着很多软件对Windows的支持越来越多,应该已经提升了不少如果有兴趣,可以尝试在Windows中构建请参考《做分析缺台主机?一文教你在win10中打造生信分析环境》
除此之外,还有一条技术路线可以走,那就是使用Docker不管你用什么系统,只要你能安装Docker,其余的都没什么区别除了镜像有点麻烦,需要一个学习和摸索的过程,强烈建议学习和使用Docker部署开发和分析环境其实不用自己去做Docker image使用Jupyterlab的官方图像或其他人定制的图像也是一个好主意
安装:
安装Bioconda
JupyterLab的安装
以及伊克内尔的安装
步骤1:安装Bioconda
根据Bioconda官方的说明:先安装Miniconda,再添加Bioconda的“通道”
Bioconda本质上是康达生物分析软件和软件包的“仓库”
在红色框中选择Python3.7 64位版本
运行以下命令进行安装:
#可以在任意路径下载安装Miniconda的脚本,安装后删除
wget https://repo . anaconda . com/miniconda/miniconda 3-latest-Linux-x86 _ 64 . sh
Miniconda3下载完成
#安装开始
sh miniconda 3-最新版-Linux-x86_64.sh
接受条款并输入以直接选择默认安装路径
您是否希望将conda信息添加到bashrc文件并在每次打开新的命令行窗口时自动启动conda base?这个最好选‘是’,不然自己设置就麻烦了,选‘否’也没什么大问题
安装完成后,可以有选择地执行后者
#如果你不想打开一个新的命令行,就执行它
来源~/没有则创建
#根据官网,因为康达有很多“渠道”,所以要按以下顺序添加
conda配置-添加通道默认值
conda配置-添加通道bioconda
康达配置-添加频道康达锻造
这些通道可以在安装后随时添加,不添加也不会有问题安装软件时,如果Miniconda的默认通道中没有你需要的软件,也可以通过参数-c 指定通道,就像下面的例子:
#这是基因组比较软件BWA的安装
康达安装-c生物康达bwa
注:为方便起见,Miniconda、Bioconda或Anaconda将统称为“conda”
安装了conda,通过conda安装JupyterLab就更容易了不需要单独安装Python,因为康达会自动排列要安装的软件和包,安装在康达的目录下或者康达虚拟环境的目录下
首先,我们使用conda创建一个虚拟环境,不仅可以更好地管理各种软件和软件包,还可以避免对系统原有环境的破坏:
#创建一个名为“bioenv”的虚拟环境
康达生物能源公司
参数
解释
创造
创建虚拟环境
同-EN
虚拟环境的名称
-p(可选)
指定虚拟环境的安装位置默认是conda下的目录
其他参数就看你自己去探索了
创建虚拟环境后,会出现这个提示
创建虚拟环境后,根据提示启动虚拟环境:
康达活化生物环境
每次安装新的软件和软件包时,最好在启动虚拟环境后安装,这样可以保证这些软件和软件包都安装在虚拟环境bioenv中,不会影响系统和其他环境
步骤2:安装R和IRkernel
在这一步中,使用两行命令来解决问题除了安装R,还需要支持在JupyterLab中使用R,所以使用IRkernel:
#先装R在这里,从“r”频道下载并安装它默认情况下,一般是r的最新稳定版本
康达insrall -c r r-base
#再次安装IRkernel
康达安装-c r r-irkernel
conda安装命令:
# xxx代表包的名称
康达安装xxx
当询问是否继续时,只需按enter键
步骤JupyterLab的安装
最后一步非常简单,一行命令解决了问题:
#可以通过康达默认仓库安装
康达安装jupyterlab
至此,基本安装完毕如果需要安装Python和R包,conda安装应该没有问题
运行并打开JupyterLab
如果它在本地运行,在已建立的bioenv环境下,简单地启动它就可以了:
#直接在命令行执行,页面会自动在默认浏览器中打开
朱庇特实验室
如果它在服务器上运行,您可以使用以下方法:
#您需要指定监听IP和端口
jupyer实验室- ip 0.0.0.0 -端口8888
参数
解释
- ip(必需)
这可以是服务器的确切IP地址,也可以是0.0.0.0,这样就可以监控所有IP网段
-端口(可选)
默认值是8888端口,或者您可以通过此参数指定要监控的端口
注意:IP、port、listening、conda和JupyterLab的高级设置不在本文讨论范围内,将在另一篇文章中详细解释
成功启动后,命令行上会出现类似上面的消息
打开JupyterLab:
这是最简单的如前所述,本地操作会自动打开浏览器并启动JupyterLab如果它部署在服务器上,请将以下信息复制并粘贴到浏览器的地址栏中,然后按enter键:
http://IP地址:port/?令牌=xxxxx
郑重声明:本文由网友发布,不代表盛行IT的观点,版权归原作者所有,仅为传播更多信息之目的,如有侵权请联系,我们将第一时间修改或删除,多谢。