Anaconda是为数据科学构建的软件包分发版。众所周知,pandas 是一个 Python 包,是数据科学操作的最佳工具。Anaconda 是一个 python 和 R 发行版,默认包含 100 多个 python 包。它也可以灵活地用于 Windows 机器和 Linux 机器。
当您下载 Anaconda 时,它会自动附带conda(package manager)、Python 和 150 多个 Python 科学包。它还具有一些默认应用程序,例如 Jupyter Notebook、Spyder、RStudio、Visual Studio Code 等等。
要安装 Anaconda,我们需要首先从 anacondas 官方网站下载 anaconda 安装程序到我们的系统中。
https://www.anaconda.com/products/individual#Downloads
根据我们的机器配置,我们需要从上面的链接下载所需的安装程序。成功下载安装程序后,我们就可以在我们的机器上安装 anaconda navigator。
Anaconda Navigator是 Anaconda 发行版提供的图形用户界面 (GUI),它使我们能够轻松管理 conda 包和启动应用程序。
在 anaconda 导航器中,我们可以看到 jupyter、spyder 等应用程序。从我们需要启动jupyter notebook的应用程序列表中,它会自动打开浏览器,因为 jupyter notebook 是一个基于 Web 的应用程序,适用于开发、记录和执行代码。我们可以在我们的工作目录中创建一个新的 jupyter notebook 文件。
创建 jupyter notebook 文件后,我们可以导入 pandas 包。
import pandas
上面这行代码将python pandas导入到我们的工作环境中,这里我们不需要额外安装pandas包。因为 anaconda 发行版会默认为您提供所有这些包。
import pandas as pd
在我们的代码块中,我们将 pandas 包重命名为 pd,这只不过是给了一个昵称。通过这样做,我们可以减少在进一步处理中调用熊猫函数的代码长度。
Anaconda 将占用我们 300GB 的系统空间用于存储,600GB 用于气隙部署,因为它带有 Python 中最常见的数据科学包,如 Numpy、pandas 等等。