机器学习入门 - 环境搭建
Anaconda 环境
我们选择使用 Anaconda 来配置在机器学习的环境。一方面其添加了许多常用的数据科学的包如 Numpy、TensorFlow 等,也包含了它们所依赖的更多模组;另一方面它能更方便地管理和切换运行环境。用一句话说,Anaconda 就是一个一站式的数据科学编程环境。
Anaconda 的下载:https://www.anaconda.com/download
安装完成后,如何开始呢?你可以看这个官方课程,一步步入手:Get Started with Anaconda,也可也直接参考以下的简明步骤开始。
当安装完成后,可以在 Anaconda Prompt 命令行界面,输入命令 conda list
验证其安装状况以及内置的包列表。
官方推荐创建一个虚拟环境,这样如果玩坏了可以直接换一个,不必重新卸载安装:
conda 默认的 channel 是 defaults
,但这个 channel 的代码包不全,所以将其更换为 conda-forge:
接着,在这个虚拟环境里安装一些常用的包:
最后,启动 JupyterLab:
scikit-learn 机器学习工具包
接下来的文章,将使用 scikit-learn 入门机器学习。scikit-learn(sklearn)包含了分类、回归、降维、聚类等基础常用的机器学习算法,也包含了特征提取、数据处理、模型评估等模块,适合入门。
参考与致谢
- 《AI 制胜:机器学习极简入门》
- Anaconda
- scikit-learn