在一个月内学习NumPy的11本书和课程[2023年]
NumPy是每个数据科学家工具箱中的扳手。它是一个非常有用的用于处理数据的库,对于所有数据科学家、分析师和工程师来说都是必备的技能。
如果你想学习这个有需求的技能,请继续阅读,本文将解释NumPy是什么,为什么它很重要,以及学习它的最佳资源。
什么是NumPy?
NumPy代表Numerical Python。它是由Travis Oliphant于2005年创建的用于数据分析的库。
NumPy的核心是数组。数组简单地是一组数据值的列表。该数组可以用于表示向量。它非常类似于Python内置的列表类型,但有一个关键的区别。
与Python列表不同,NumPy中的数据存储在连续的内存中。这意味着值在内存中相邻存储。这使得访问这些值更快;对于常见的操作,NumPy数组比Python列表快50倍。
与Python列表一样,数组可以存储其他数组作为元素。这允许你创建更复杂的数学构造,如矩阵和高阶数组。数组具有用于常见统计操作的有用方法,如计算均值、中位数和标准差。你可以通过拆分、连接、形状和重塑来修改它们。
使用NumPy的要求
- Python安装
- Pip安装
- IDE,如VSCode,或者更理想的是基于Notebook的IDE,如Jupyter
- Python的知识
用途
- Numpy由于其快速的数组而被用于数据科学任务,而不是使用内置的Python列表。
- 它可以使用其内置函数解决线性代数问题。
- 由于其快速计算向量和矩阵,它被用于机器学习。
- 它可以使用其随机统计函数生成随机数据集。
学习NumPy的课程
以下是学习NumPy和数据科学的最佳资源之一。这些资源大多都假设你对Python有一定的了解。如果你还没有学习Python,这里是我们的最佳学习资源列表:resources to learn Python
深度学习先决条件:Python中的Numpy堆栈
这门Udemy课程为你提供了一个温和的指南,以准备你使用Python进行深度学习。该课程教你如何使用Numpy进行向量和矩阵计算。
此外,它还涵盖了Pandas(用于处理Python数据集的库):Matplotlib(数据可视化工具)和Scipy(用于在Python中计算统计数据的库)。
该课程包含六小时的点播视频,购买后可以免费终身访问。它包括一个证书。在尝试这门课程之前,你应该对线性代数和Python编程有一定的了解和熟悉。
使用Python进行数据分析:NumPy和Pandas大师班
这门综合课程教你如何使用Pandas和NumPy分析数据。该方法包括216个讲座,3篇文章和2个可下载资源。这总共给你超过13个小时的内容。
它首先介绍了NumPy和数组的概念,数组是NumPy中的核心对象。然后,该课程将教你使用Pandas,这是一个流行且实用的用于处理数据集的库。最后,你将学习使用Matplotlib库进行数据可视化。
这门课程与大多数课程的不同之处在于,通过角色扮演使课程更实际。你将扮演一家大型跨国零售公司的数据分析师的角色,分析从其不同运营部门收集的数据。正如预期的那样,该课程在开始之前假设你对Python有一定的了解。
针对初学者的Python和NumPy
这门课程是NumPy中最适合初学者的课程之一。虽然你需要了解Python,但该课程从头开始介绍了NumPy。
它首先介绍了NumPy数组。它解释了它们与Python列表的区别,以及它们在数据科学、工程和分析方面更快且更适合的特点。
此外,你将学习到可以对这些数组进行的各种操作。其中包括但不限于创建数组、使用索引访问数组、对数组进行切片和连接以及对数组进行形状调整和重塑。
该课程包含两小时的视频内容,只关注NumPy。你可以在一周内完成并获得认证。
NumPy入门
这门课程由DataCamp提供,并且适合初学者学习NumPy。该课程时长约为4小时,包括13个制作精良的视频和49个练习,帮助你巩固所学的概念。
它是数据科学家路径的一部分,所以如果你完成了该路径中的其他课程,你将获得DataCamp数据科学家认证。
至于内容,它介绍了数组,并解释了在Python中使用数组而不是列表的优势。接下来,你将学习广播和向量化技术,以使你的代码更快、更高效。你将在Monet数据集上练习数组操作。
Simplilearn NumPy教程
这篇free tutorial by Simplilearn介绍了NumPy的基础知识。它简短明了,直截了当。文章中只有最少的解释,如果你把它作为参考使用,或者你已经知道NumPy是什么以及不同的函数是做什么的,这篇文章是理想的选择。
文章中还包含了代码片段,以示例的形式说明了不同函数的用法。如果你赶时间,想在十分钟内学会NumPy,这篇文章是理想的选择。作为一篇文章,它没有练习的地方或者用的数据集。
你需要自己设置一个练习环境,并找到数据集来练习。Kaggle是寻找数据集并创建笔记本进行数据科学练习的好地方。
W3Schools
这篇tutorial by W3Schools是我个人最喜欢的。它免费且内容全面,涵盖了NumPy的所有基础知识和更高级的主题,如生成随机统计分布和使用通用函数实现向量化。
总共,该教程有43个网页,简洁但足够的解释和代码片段用例子进行说明。此外,w3schools还提供了一个编辑器,用于编写你的NumPy查询,以及一个测验,可以测试你的知识。
所有这些都是可选的,但会有助于你的学习体验。通过付费报名NumPy课程,你可以获得一份证书,可以添加到你的简历中。
Scaler课程
这个course on Scaler组织得很好。它包括六个模块,介绍了NumPy的基础知识、多维数组、数据结构、函数、广播和其他杂项概念。
总共有32节课,视频内容为5小时33分钟。有26个挑战帮助你应用所学,并巩固你的概念。完成课程后,你将获得一份证书。
如预期的那样,你在开始课程之前必须了解Python编程语言。第二个先决条件是在你的计算机上安装有Python和NumPy的IDE。
Travis Oliphant的NumPy指南
这本书是由NumPy的创始人编写的,旨在成为那些已经了解Python但想学习NumPy和其他工具的人的参考资料。
预览 | 产品 | 评分 | 价格 | |
---|---|---|---|---|
|
Guide to NumPy: 2nd Edition | $49.95 | Buy on Amazon |
Travis Oliphant在这本书中不仅介绍了如何使用Numpy,还介绍了如何使用API进行扩展。这可能是关于Numpy最详尽和详细的资源。
这本书可能非常适合Numpy的高级用户,他们希望对Numpy的工作原理有更高层次的理解,并提供详细的指南,以便能够为该库做出贡献并进行扩展。
Ivan Idris的Numpy初学者指南
这本关于Numpy的书籍旨在面向初学者。它适用于科学家、工程师、程序员和分析师,他们已经熟悉Python,但希望通过掌握Numpy来扩展他们的技能。
预览 | 产品 | 评分 | 价格 | |
---|---|---|---|---|
|
NumPy: Beginner’s Guide – Third Edition | $40.51 | Buy on Amazon |
本书介绍了在本地计算机上安装Numpy、Matplotlib、Scipy和IPython。然后介绍了数组和可用的不同数组函数。然后,您将使用该库执行矩阵运算,并使用Numpy.testing
测试您的代码。总的来说,这本书是Numpy的全面指南。
Karan Singh Bisht的NumPy:从基础到高级
标题“NumPy从基础到高级”已经说明了一切。这本书旨在成为一个温和的斜坡,从不了解该库到知道如何使用其中一些更高级的功能。
预览 | 产品 | 评分 | 价格 | |
---|---|---|---|---|
|
NumPy : From Basic to Advance: for machine learning | 尚无评分 | $39.99 | Buy on Amazon |
这本书涵盖了基础知识,例如解释了什么是数组,以及更高级和底层的主题,例如CPU缓存效应和Ndarray的生命周期。它旨在为使用Numpy库进行进一步机器学习工作提供坚实的基础。
FreeCodeCamp的YouTube教程
FreeCodeCamp最近在编程和软件开发教程方面越来越受欢迎。在其教程目录中有这个全面的Numpy教程。与其所有教程一样,它是免费提供的。
该教程大约有一个小时,介绍了Numpy的基础知识。它是对该库的温和介绍,对于刚开始学习的人来说不会过于压力。预期观看视频之前具备Python知识。
最后的话
Numpy非常有用且多功能。它是大多数数据科学和工程岗位所需的工具。本文向您介绍了Numpy,并对其关键概念进行了高层次和抽象的概述。
此外,本文列出了可能对您学习Python的旅程有帮助的资源。对每个资源的简要描述可以帮助您做出明智的选择。
接下来,查看数据科学家的最佳Python libraries。