猪小花1号

个人签名

282篇博客

数据科学实战(七):在 Mac OS X 和 Linux 上安装 Python 数据库

猪小花1号2018-12-26 10:37

1.6 在 Mac OS X 和 Linux 上安装 Python 数据库

虽然常常称Python是“自带电池的”,但其自带的包往往不能发挥这个语言在数据分析上的强大功能。在本节,我们将安装一个名为SciPy的“兵器库”,它包括NumPy、SciPy、pandas、matplotlib和Jupyter。


1.6.1 准备工作
假设你已经安装了标准的Python。在前一节如果你决定安装Anaconda版本(或者Python的其他自带所需库的版本),那么你可以忽略这部分。为了检查特定的Python包是否已恰当地安装,请打开你的Python解释器并试着载入包。如果成功,则说明包已经安装在了你的机器上。为了实现这个操作,你可需要通过sudo命令来获得机器的根访问权限。


1.6.2 操作流程
以下步骤将帮助你在Linux操作系统中安装Python数据分析库。


1.你需要知道使用的Linux版本。Linux版本常常决定了你使用的包管理系统,包括apt-get、yum以及rpm。


2.打开浏览器,输入http://www.scipy.org/install.html,这里包含适用于多数操作系统的安装方案。


3.如果有变化,则这些指南可以用如下步骤代替。
(1)打开shell。
(2)如果你使用的是Ubuntu或者Debian,则输入如下代码:
sudo apt-get install build-essential python-dev pythonsetuptools
python-numpy python-scipy python-matplotlib
ipython
ipython-notebook python-pandas python-sympy python-nose


(3)如果你使用的是
Fedora,则输入如下代码:
sudo yum install numpy scipy python-matplotlib ipython
python-pandas sympy python-nose


4.在OS X系统的Macintosh上安装Python数据分析库,有多种选择。
(1)第一个选择是每个工具都下载一个已经预编译过的安装包(.dmg),然后像安装Mac应用一样,安装它们(我们推荐这种方法)。
(2)第二个选择是,如果你的Mac上有MacPorts(一个安装软件的命令行工具系统),并且也安装了XCode,那么你只需要输入:
sudo port install py27-numpy py27-scipy py27-matplotlib
py27- ipython +notebook py27-pandas py27-sympy py27-nose


(3)第三个选择是Chris Fonnesbeck提供的一种经测试可行的安装方法,本书中所有的包都可以通过这种方式安装。请参考http://fonnesbeck.github.io/ ScipySuperpack。上述方法都会花费一些时间,因为需要安装大量的软件。


1.6.3 工作原理
历史上,安装SciPy库曾经非常有挑战,因为安装过程非常繁复,甚至还需要Fortran。因此,我们不建议你自己从源代码开始进行编译,除非你自己乐于折腾这些内容。


现在,一个自然的问题是:我们刚刚都安装了些什么?我们安装了NumPy、SciPy、matplotlib、IPython、IPython Notebook、pandas、SymPy和nose的最新版本。这些包的描述如下。


zSciPy:这是一个基于Python的开源包,用于数学、科学、工程,以及一些很有用的机器学习、科学计算和建模的库。


zNumPy:这是一个非常基础的Python包,提供了数值计算功能。因为它提供的计算方式与C很像,所以其速度非常快,尤其是当你需要处理高维数组和线性代数运算时。正是因为有了NumPy,Python才可以进行其他语言无法企及的如此高效的大规模数值计算。zmatplotlib:这是一个非常好用并且可以扩展的2D绘图库,而且其用法对于MATLAB用户来说是非常熟悉的。


zIPython:这个包提供了非常丰富并且强大的Python shell。对于标准Python REPL(Read-Eval-Print-Loop)而言,它是一个很好的替代。


zIPython Notebook:这是一个基于浏览器的Python工具,可以支持代码、格式化文件、markdown、图形、图像、声音、影像以及数学表达式的编辑和记录。zpandas:这个包提供了一个非常稳健的数据框对象,并且提供了很多扩展工具,这让传统的数据和统计分析变得更简单和快速。


znose:这是一个测试工具,它扩展了Python标准库的单元测试框架。


1.6.4 更多内容
在后续章,我们将更深入地讨论上述包。然而,如果我们不提Python IDE,肯定会被人认为是不专业的。简单来说,我们推荐在你最喜欢的文本编辑器中集成Python的IDE,比如来自GitHub的开源的Atom、sublime,或者Ruby程序员最爱的TextMate。Vim和Emacs也是非常好的选择,因为它们除了功能强大之外,还可以很容易地在远程服务器上使用(数据科学家经常使用这种工作方式)。这些编辑器都有很多插件,它们可以提供代码补全、高亮、缩进等功能。如果你一定要选择一个IDE,那么可以试试PyCharm(社区版本是免费的)。你会发现大多数Python IDE比处理数据更适合网页开发。


内容来源:异步社区;版权属【人民邮电出版社 异步社区】所有,转载已获得授权;未经授权,不得以任何方式复制和传播本书内容,如需转载请联系异步社区。