工具

什么是Google JAX？你需要了解的一切

By姚伟斌 November 9, 2023August 30, 2023

Google JAX或J ust After E xecution是由Google开发的一种框架，用于加速机器学习任务。

您可以将其视为Python的库，有助于更快的任务执行、科学计算、函数转换、深度学习、神经网络等。

关于Google JAX

Python中最基本的计算包是NumPy包，其中包含了所有的聚合函数、向量运算、线性代数、n维数组和矩阵操作以及许多其他高级函数。

如果我们可以进一步加速使用NumPy进行的计算——尤其是对于大型数据集呢？

我们是否有一种可以在不进行任何代码更改的情况下同样适用于GPU或TPU等不同类型的处理器的方法呢？

如果系统可以自动且更高效地执行可组合的函数转换会怎样呢？

Google JAX是一个库（或框架，正如维基百科所说），它恰好可以做到这一点，或许还能做得更多。它是为了优化性能并高效执行机器学习（ML）和深度学习任务而构建的。Google JAX提供了以下变换特性，使其与其他ML库不同，并有助于深度学习和神经网络的高级科学计算：

自动微分
自动向量化
自动并行化
即时（JIT）编译

所有这些转换都使用XLA（加速线性代数）进行更高的性能和内存优化。XLA是一个特定领域的优化编译器引擎，用于执行线性代数并加速TensorFlow模型。在您的Python代码之上使用XLA不需要进行重大的代码更改！

让我们详细探讨每个功能。

Google JAX的特性

Google JAX带有重要的可组合变换函数，以提高性能并更高效地执行深度学习任务。例如，自动微分可以获得函数的梯度并找到任意阶导数。类似地，自动并行化和JIT可以并行执行多个任务。这些转换对于机器人技术、游戏甚至研究等应用至关重要。

一个可组合的变换函数是一个纯函数，它将一组数据转换为另一种形式。它们被称为可组合，因为它们是自包含的（即这些函数与程序的其余部分没有依赖关系）且是无状态的（即相同的输入总是产生相同的输出）。

Y(x) = T: (f(x))

在上述公式中，f(x)是应用变换的原始函数。Y(x)是应用变换后的结果函数。

例如，如果您有一个名为'total_bill_amt'的函数，并且希望将结果作为函数转换，您可以简单地使用您希望使用的转换，比如梯度（grad）：

grad_total_bill = grad(total_bill_amt)

通过使用类似grad()的函数转换数值函数，我们可以轻松地获得它们的高阶导数，在深度学习优化算法（如梯度下降）中广泛使用，从而使算法更快更高效。同样地，通过使用jit()，我们可以即时编译Python程序。

#1. 自动微分

Python使用autograd函数来自动区分NumPy和本地Python代码。JAX使用改进版的autograd（即grad）并结合XLA（加速线性代数）来执行自动区分并找到GPU（图形处理单元）和TPU（张量处理单元）的任意阶导数。

关于TPU，GPU和CPU的快速说明：CPU或中央处理单元管理计算机上的所有操作。GPU是一个附加处理器，增强计算能力并运行高端操作。TPU是专为复杂和繁重工作负载（如AI和深度学习算法）而开发的强大单元。

与autograd函数相同，它可以通过循环、递归、分支等进行区分，JAX使用grad()函数进行反向传播。此外，我们可以使用grad对函数进行任意阶的区分：

grad(grad(grad(sin θ))) (1.0)

更高阶的自动区分

正如我们之前提到的，grad在找到函数的偏导数方面非常有用。我们可以使用偏导数来计算深度学习中与神经网络参数相关的成本函数的梯度下降，以最小化损失。

计算偏导数

假设一个函数有多个变量x、y和z。通过保持其他变量不变来找到一个变量的导数称为偏导数。设我们有一个函数

f(x,y,z) = x + 2y + z²

用例展示偏导数

x的偏导数将是∂f/∂x，它告诉我们在其他变量保持不变时函数如何改变。如果我们手动执行此操作，我们必须编写一个程序来进行区分，为每个变量应用它，然后计算梯度下降。对于多个变量，这将变得复杂且耗时。

自动区分将函数分解为一组基本运算，如+、-、*、/或sin、cos、tan、exp等，并使用链式法则计算导数。我们可以在正向和反向模式下进行。

这还不是全部！所有这些计算发生得非常快（想象一下类似上面的百万个计算及其所需的时间！）。XLA负责速度和性能。

#2. 加速线性代数

让我们看看之前的方程。如果没有XLA，计算将需要三个（或更多）内核，其中每个内核将执行一个较小的任务。例如：

内核k1 –> x * 2y（乘法）

k2 –> x * 2y + z（加法）

k3 –> 缩减

如果使用XLA执行相同的任务，一个单独的内核将通过融合中间操作来处理所有操作。基本运算的中间结果被流式传输而不是存储在内存中，从而节省内存并提高速度。

#3. 即时编译

JAX内部使用XLA编译器来提高执行速度。XLA可以提升CPU、GPU和TPU的速度。所有这些都可以通过JIT代码执行来实现。要使用此功能，我们可以通过导入使用jit：

from jax import jit
def my_function(x):
	…………一些代码行
my_function_jit = jit(my_function)

另一种方法是在函数定义上使用jit进行装饰：

@jit
def my_function(x):
	…………一些代码行

这段代码要快得多，因为变换将返回编译后的代码版本给调用者，而不是使用Python解释器。这对于矢量输入（如数组和矩阵）特别有用。

这对所有现有的Python函数也是适用的，例如NumPy包中的函数。在这种情况下，我们应该导入jax.numpy as jnp而不是NumPy:

import jax
import jax.numpy as jnp

x = jnp.array([[1,2,3,4], [5,6,7,8]])

一旦你这样做了，核心JAX数组对象DeviceArray将替代标准的NumPy数组。DeviceArray是惰性的，即值在加速器中保留，直到需要。这也意味着JAX程序不会等待结果返回给调用（Python）程序，从而实现异步调度。

#4. 自动向量化（vmap）

在典型的机器学习世界中，我们有包含百万甚至更多数据点的数据集。很可能，我们需要对每个或大多数这些数据点执行一些计算或操作–这是一个非常耗时和占用内存的任务！例如，如果你想在数据集中找到每个数据点的平方，你首先想到的是创建一个循环并逐个取平方–烦死人！

如果我们将这些点创建为向量，我们可以通过使用我们喜欢的NumPy对数据点进行向量或矩阵操作来一次完成所有平方。如果你的程序可以自动完成这个过程–你还能要求什么呢？这正是JAX所做的！它可以自动将所有数据点向量化，以便你可以轻松地对它们执行任何操作–使你的算法更快，更高效。

JAX使用vmap函数进行自动向量化。考虑以下数组：

x = jnp.array([1,2,3,4,5,6,7,8,9,10])
y = jnp.square(x)

仅通过上述操作，平方方法将对数组中的每个点执行。但如果你执行以下操作：

vmap(jnp.square(x))

由于数据点现在在执行函数之前自动向量化，而不是标量乘法，循环被推入到基本的操作级别中–从而产生矩阵乘法而不是标量乘法，从而提高性能。

#5. SPMD编程（pmap）

SPMD–或单一程序多个数据编程在深度学习环境中非常重要–你经常需要在多个GPU或TPU上的不同数据集上应用相同的函数。JAX具有一个名为pump的函数，允许在多个GPU或任何加速器上进行并行编程。像JIT一样，使用pmap的程序将由XLA编译，并在系统中同时执行。这种自动并行化对于正向和反向计算都起作用。

我们还可以在任何顺序上一次性应用多个转换到任何函数上：

pmap(vmap(jit(grad (f(x)))))

多个可组合的转换

Google JAX的局限性

Google JAX的开发人员对加速算法考虑得很周到，同时引入了所有这些令人惊叹的变换。科学计算函数和包与NumPy类似，因此您不必担心学习曲线。然而，JAX有以下限制：

Google JAX仍处于早期开发阶段，尽管其主要目的是性能优化，但对于CPU计算并没有太大的好处。NumPy似乎表现更好，使用JAX可能只会增加开销。
JAX仍处于研究或早期阶段，需要更多的微调才能达到像TensorFlow这样的框架的基础设施标准，后者更为成熟并具有更多预定义的模型、开源项目和学习资料。
目前，JAX不支持Windows操作系统-您需要使用虚拟机使其正常工作。
JAX仅适用于纯函数-那些没有任何副作用的函数。对于具有副作用的函数，JAX可能不是一个好选择。

如何在Python环境中安装JAX

如果您的系统上设置了Python，并且想在本地机器（CPU）上运行JAX，请使用以下命令：

pip install --upgrade pip
pip install --upgrade "jax[cpu]"

如果您想在GPU或TPU上运行Google JAX，请按照链接3的说明进行操作。要设置Python，请访问链接4的页面。

结论

Google JAX非常适用于编写高效的深度学习算法、机器人技术和研究。尽管存在一些限制，但它与Haiku、Flax等其他框架广泛配合使用。当您运行程序并查看使用和不使用JAX执行代码的时间差异时，您将能够欣赏到JAX的作用。您可以从阅读链接5开始，该链接非常全面。

姚伟斌

程序猿

我是姚伟斌，也被称为文景。我的专业领域涵盖了开放源代码的深度探索、网络编程和网络建站。我热衷于分享我的编程和建站实践经验，尤其擅长于Nginx和Proxy服务器的管理。此外，我还对Python和NodeJS这两种编程语言有着深刻的理解和独到的见解。

最近，我致力于爬虫技术的研究，探索如何通过高效的数据抓取为项目增添价值。我的目标是通过持续的学习和创新，为开放源代码社区贡献我的力量，并帮助那些对网络编程和网站建设感兴趣的人士。

工具

数字孪生是什么，为什么在物联网中很重要？

By姚伟斌 November 10, 2023September 11, 2023

未来准备好的企业通过数字孪生技术高效创建、排除故障、更新和创新物理或数字产品。不知道什么是数字孪生？请继续阅读！物联网(Internet of Things IoT)使企业能够从真实世界收集大量数据。当用于商业目的时，物联网改变了各种制造和服务交付过程。它还帮助企业为新产品/服务和现有产品/服务创建实时模拟。由物联网驱动的先进仿真或数字孪生概念可以为您提供来自现场的准确数据。如果您在技术和理论上学习数字孪生概念，您就开启了广阔的机会。您可以为大企业建立数字孪生代理解决方案，或在顶级公司获得高薪工作。更不用说，您还可以在您的业务中使用这项技术。所以，让我们来学习关于数字孪生的一切。什么是数字孪生？数字孪生是物理产品、资产、劳动力、业务流程工作流和数字软件的虚拟和计算机化模型。在产品生命周期中，数字孪生通过传感器和调查输入获取实时数据。数据分析算法分析收集到的数据以显示未来的预测。因此，产品开发团队可以调试任何产品，在下一个开发周期中改进产品，发现新的商业想法等。凡是与商业利益相关的内容都可能有数字孪生。一切都可以在计算机程序中复制，从简单的产品仓库到公司总部，太空船，海上石油钻井平台，超级高铁系统，CRMs和网络安全软件。数字孪生是如何工作的？数字孪生的旅程始于对物理对象的图形复制创建。例如，如果您希望获取办公楼的数字复制品，可以使用任何建筑架构的CAD software。然后，您还可以使用3D扫描仪对建筑的各个内部空间进行扫描，使数字复制品几乎逼真。…

工具

使用这9个工具创建交互式视频，以提高参与度

By姚伟斌 November 5, 2023September 12, 2023

数字世界正朝着更多视频内容的方向发展。一切都可以随手可得；通过视频内容可以触达更广泛的受众。每个品牌都在采用不同的营销策略来获取提升。然而，大多数公司都面临着video content for engagement的困扰。营销人员正不断努力寻找不同的策略来吸引受众，并尝试不同的方式来将受众引入销售渠道。受众不再满足于传统的参与体验，他们正在寻找多样化的内容。这就是营销人员转向创建interactive content的方向。许多品牌采用互动视频的策略来推动销售。让我们更深入地了解一下互动视频。什么是互动视频？市场上对视频内容的需求非常高。而当您使用互动视频时，您的营销活动的效果将达到一个新的水平。这就像提供了一个全面的参与解决方案。品牌之所以喜欢互动视频，主要原因是观众喜欢观看这些视频。如果您将线性视频与互动视频进行比较，您会注意到它们在结果上有很大的差别。互动视频将使观众变得主动，而不是被动地坐在屏幕前。这些视频还将使观众在您的视频上停留更长时间，并增加社交分享。互动视频的功能互动视频具有许多线性视频所没有的功能。它们是吸引更多受众的最佳方式。互动视频的一些主要功能包括：热点…

工具

数据转换简明指南

By姚伟斌 December 8, 2023August 31, 2023

寻找有关数据转换的快速指南？这里提供了关于其类型、优点和工具的完整信息。

工具

WebSphere 8.5 管理课程

By姚伟斌 December 14, 2023September 11, 2023

IBM WebSphere Application Server 8.5 管理书籍更新：我不再维护这门课程。您可以在Udemy上找到类似或其他课程。这是我的

工具

在5分钟内像专业人士一样修复Windows中的“内存不足”错误

By姚伟斌 November 5, 2023September 13, 2023

如果你经常打开多个程序并忽略关闭正在运行的后台窗口，或者同时执行资源密集型任务，那么你更有可能遇到“内存不足”错误。通常情况下，当你的内存已经分配给正在运行的进程，你的操作系统没有足够的内存来执行即将到来的任务时，系统会显示“内存不足”错误。好消息是，在许多情况下你可以自己修复这个问题。以下是详细的逐步解决方案，帮助你修复Windows中的“内存不足”错误。然而，了解任何错误的原因是解决问题的关键。所以首先，让我们看一些引起关注的主要原因，然后深入修复方法！ “内存不足”错误的常见原因内存不足：如果你的机器没有足够的RAM剩余来处理你想要运行的任何应用程序、执行的任何程序或访问的任何文件，那么系统会显示“内存不足”错误。启动程序：当你重新启动或者全新启动你的系统时，会有一些与系统启动相关的特定任务或应用程序会自动在后台运行。这些进程通常被称为启动程序。如果这些程序消耗了你系统资源的主要部分，包括RAM，那么你可能会在Windows中遇到“内存不足”错误。过时硬件：你是否还在使用你在90年代甚至更早时期购买的计算机，直到今天还没有升级其硬件？那么这台机器导致“内存不足”错误也就不足为奇了，因为旧系统通常具有诸如低RAM或慢处理器等资源限制。因此，这些规格无法处理当今的数据或处理需求，导致许多错误，包括存储问题，如“内存不足”错误。繁重任务：运行繁重的PC游戏、创建3D模型，甚至编辑高质量视频都需要大量的计算资源。因此，当你的系统无法再提供内存时，就会出现错误。恶意软件：后台运行的恶意软件可能会占用你的系统内存，不留空间供预期的应用程序处理。这可能导致“内存不足”错误。内存泄漏：你的系统中的一些应用程序可能不会释放已使用的内存，积累堵塞的内存块，其他应用程序无法重用，从而导致Windows 10或11中的“内存不足”错误。在深入了解综合解决方案之前，试试这些快速修复方法。…

工具

11个最佳的流数据平台，用于实时分析和处理

By姚伟斌 November 14, 2023September 12, 2023

我们生活的世界是由数据驱动的。获取实时强大的洞察力，对真实世界的数据进行处理，让您的业务具有优势。数据流允许持续捕获和处理来自各种数据源的数据，这就是为什么良好的数据流平台很重要。数据流平台是可扩展、分布式和高效的系统，确保可靠处理数据流。它们支持数据聚合和分析，并通常配备统一的仪表板来可视化您的数据。您可以选择各种数据流平台和解决方案 – 从完全托管的系统（如confluent cloud和amazon kinesis）到开源解决方案（如arroyo和fluvio）。数据流有哪些用途？数据流平台覆盖了广泛的用例。让我们快速浏览一下其中的一些：通过持续分析交易、用户行为和模式来处理欺诈检测。股票市场交易数据由多个系统捕获，根据市场分析进行高速大量交易。通过实时市场数据提供定制见解，为电子商务市场提供正确的目标受众。各种系统中有数百万个传感器提供实际世界数据，并帮助进行天气预报等预测信息。以下是用于您的所有实时分析和流处理需求的最佳数据平台。 confluent cloud…