Python、R、Julia混合编程环境配置及相关工具安装

1  Python环境配置

1.1   安装Anaconda

  • Conda 是一个开源的软件包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系,并在它们之间轻松切换。
  • Conda 是为 Python 程序创建的,适用于 Linux,OS X 和Windows,也可以打包和分发其他软件。
  • 目前最流行的 Python 环境管理工具。
  • Anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。

Anaconda下载地址:https://www.anaconda.com/download/


最好是64位的版本(除非你的电脑是32位的)。这里选择3.X或者2.X没关系,都可以,但建议选Python3版本。

检查并配置环境变量

Windows环境变量:

请查看环境变量中是否有以下三个路径,若没有请自行添加:

  1. 默认路径本身;
  2. 默认路径+”Scripts”;
  3. 默认路径+”Libraryin”

默认路径即为安装Anaconda时所设置的路径。例如:默认路径为:”C:UsersAdministratorAnaconda3”,那么需要添加的三个路径则是:

  • C:UsersAdministratorAnaconda3;
  • C:UsersAdministratorAnaconda3Scripts;
  • C:UsersAdministratorAnaconda3Libraryin
    第一个路径是Miniconda的根目录,也是最重要的路径!

1.2   添加conda的国内国内镜像服务器

因为conda下载文件要用到国外的服务器,速度一般会比较慢,我们可以通过增加一个清华的镜像服务器来解决。
打开cmd终端或者Anaconda Prompt(快捷键: win+r :然后输入cmd,回车)。
分别在cmd终端或者Anaconda Prompt里粘贴下面两行代码(每粘贴一行回车确认)。

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes

1.3   创建Python虚拟环境

在 cmd 终端输入: conda create –n 环境名称 python=版本号
例如创建名称为course_py35,版本为python3.5的虚拟环境,cmd输入:conda create –n course_py35 python=3.5
安装工具包的时候可能需要安装一些其他的工具,如果系统提示 proceed ([y]/n)? ,输入y, 回车就ok。
出现如下图提示 “To activate this environment……”表示环境配置成功

尝试触发刚创建的这个环境,输入: activate course_py35
这里如果你用的是其他的名字,输入activate 名称就可以了
如果命令行出现(course_py35)或者说是你自己设定的名称,表示已经载入这个环境

你可以选择查看 Python 的版本是否是我们刚创建的3.5版本,输入:python
不出意外的话,系统会给你反馈 python 的版本信息
输入:quit()
退出 python 环境(注意:此处的括号为英文状态下输入的)

1.4   安装所需的 python 工具包

可选择用conda或者pip安装包,为方便起见,先对conda和pip进行升级,cmd输入命令:

conda update conda
python -m pip  install --upgrade pip

包安装命令:

conda install package_name
pip install package_name

包升级命令:

conda update package_name
pip  install --upgrade package_name

包移除命令:

conda uninstall package_name
pip uninstall package_name

数据科学python常用包:

numpy:为大型多维数组和矩阵添加Python支持,以及在这些数组上运行高级数学函数的大型添加包。
scipy:用于科学计算的基础库。
pandas:为Python中的数据结构、数据操作和分析编写的添加包。
matplotlib:用于图形和数据可视化的全面2D绘图。
seabron:基于matplotlib的Python可视化库。它提供了一个高级界面,用于绘制有吸引力的统计图形。
scikit-learn:一个机器学习库。
networkx:复杂网络分析库。
statsmodels:用于构建统计模型。
beautiful soup:用于网络爬虫。
tweepy:用于Twitter抓取。
bokeh :一个Python交互式可视化库,面向现代Web浏览器进行演示。它的目标不仅是以D3.js的风格提供优雅、简洁的新颖图形结构,而且还通过非常大或连续传播的数据集提供高性能交互功能。它有Python、Scala、Julia以及现在的R接口。

2   R环境配置

2.1   R下载与安装

R官网地址:https://www.r-project.org/

R下载地址:https://cran.r-project.org/mirrors.html

为保证下载速度,可选择国内镜像地址

检查环境变量

环境路径:“默认路径inx64”
CMD下输入R可进入R的控制台界面,如下图:

2.2   R语言安装R package:

(1)自动安装(在线安装)

在R的控制台输入:install.packages("package_name")
这种方法可能找不到需要的package,那么可以用 方法2

(2)手动安装(离线安装)

Windows:

下载package.zip文件

打开R的菜单栏->Packages->“Install package from local zip file…”

选择package.zip文件

查看全部安装的R包:.packages(all.available=T)
查看某个安装的R包:
library("XML")
help(package="XML")
R下常用包:

ggplot:基于R的ggplot2和图形语法的Python绘图系统。它专为使用最少的代码快速制作具有专业外观的图而构建。

对于R,查看添加包的最佳方法是查看CRAN任务视图,其中,添加包按使用类型聚合。

https://cran.r-project.org/web/views/

例如,有关高性能计算的CRAN任务视图,请访问:

https://cran.r-project.org/web/views/HighPerformanceComputing.html

3   Julia环境配置

3.1 Julia下载与安装

Julia下载地址:https://julialang.org/

julia最新版本为julia-1.0.3,建议安装最新版本

环境变量路径:"默认路径Julia-1.0.3in"

启动:cmd输入julia,如下图:

3.2 Julia配置

(1)julia安装package

julia安装package有两种方法:
一种是通过Pkg.add()命令安装:在julia交互式环境输入以下命令:

using Pkg
Pkg.add("package_name")

另一种方法是针对1.0以上版本,在julia交互式环境下输入']'切换至Pkg操作界面,如下图:
通过add package_name命令安装。
注意:由于julia服务器在国外,package安装时会由于网络不稳定出现失败,此时一个有效的解决办法是到本地存放package文件夹下找到安装失败的package手动删除后重新安装。window下默认的存放package的路径为:“C:Users用户名.juliapackages”。
关于julia的第三方包的详细信息可以通过https://juliaobserver.com/ 查询。

(2)julia配置

Julia 的 REPL(交互式编程环境) 扩展性很强,比较有名的比如 OhMyREPL,它可以提供代码高亮,代码补全等功能。可在REPL中通过以下命令安装和使用:

using Pkg
Pkg.add("OhMyREPL") //安装包
using OhMyREPL //调用包

以上命令为Julia安装和使用package的通用方法,后面不在赘述。
关于OhMyREPL的详细配置可以参考其官方文档:https://kristofferc.github.io/OhMyREPL.jl

(3)julia调用Python、R混合编程

Julia可以方便的调用Python和R,主要通过PyCallRCallConda三个包来实现,详细操作可查看其文档说明。
注意:安装julia第三方包时,最好先查看其官方文档,确定适用版本后再安装使用。

4   关于IDE

目前,有很多IDE可同时搭建Python、R、Julia环境,如Vscode、Atom等,在此推荐Jupyter Lab,相比工程开发,其更适用于科学实验。

Jupyter源于Ipython Notebook,是使用Python(也有R、Julia、Node等其他语言的内核)进行代码演示、数据分析、可视化、教学的很好的工具,对Python的愈加流行和在AI领域的领导地位有很大的推动作用。

Jupyter Lab是Jupyter的一个拓展,提供了更好的用户体验,例如可以同时在一个浏览器页面打开编辑多个Notebook,Ipython console和terminal终端,并且支持预览和编辑更多种类的文件,如代码文件,Markdown文档,json,yml,csv,各种格式的图片,vega文件(一种使用json定义图表的语言)和geojson(用json表示地理对象),还可以使用Jupyter Lab连接Google Drive等云存储服务,极大得提升了生产力。
安装Anaconda后,会包括jupyter notebook和Ipython内核,接下来需要完成三个步骤即可:

(1)安装jupyter lab

pip install jupyterlab

(2)安装R kernel

#在R中运行如下代码,来安装依赖的R包
install.packages(c('repr', 'IRdisplay', 'evaluate', 'crayon', 'pbdZMQ', 'devtools', 'uuid', 'digest'))
devtools::install_github('IRkernel/IRkernel')
#在R中运行如下代码,使得R在jupyter中可以被探测到。
IRkernel::installspec(user = FALSE)

报错,可以尝试:

> devtools::install_github('IRkernel/IRkernel',force = TRUE)
> install.packages("digest") 
> devtools::install_github('IRkernel/IRkernel',force = TRUE)

(3)安装Julia kernel

#在julia REPL中运行以下代码
using Pkg
Pkg.add("IJulia")

启动Jupyter Lab

在cmd下输入:jupyter lab即可,界面如下图:

注意:windows下启动可能会出现错误,此时可能需将系统防火墙关闭。

以上即为本人在配置Julia、Python、R混合编程环境过程中的简单总结,如有问题,恳请指正。

原文地址:https://www.cnblogs.com/luoh382/p/PythonRJulia-hun-he-bian-cheng-huan-jing-pei-zhi-j.html