如何将Python集成到Power BI中

power bi是一个非常有用的数据分析和可视化平台。使用power bi,业务用户可以从其他无意义的数据记录中创建报告和仪表板。

这些报告和仪表板是互动的,可以与团队成员共享。这使得power bi成为商业智能中受欢迎的工具。

在本文中,我将演示如何将power bi与python集成-另一种用于数据分析的流行编程语言。

为什么要在power bi中集成python

python是一种流行的编程语言,相对易于学习,因此被数据分析师或其他希望编写代码但不是全职程序员的专业人员所青睐。将其集成到power bi中具有许多优点,例如:

  • 可以使用api编程方式导入数据。当将不同的系统集成在一起时,如将用户数据库系统与power bi集成以进行实时使用分析,这非常有用。
  • 可以以power bi本身不支持的更多方式可视化数据。python与power bi的集成使您可以使用诸如matplotlib等库创建自定义可视化。

还可阅读:microsoft power bi数据分析师认证(pl-300):如何获得

言归正传,让我们看看如何将python集成到power bi中。

如何将python集成到power bi中

power bi desktop只能在windows上运行。因此,对于本指南,我将假设您在windows机器上进行此操作。要将power bi与python集成,您需要按照以下步骤进行操作:

安装python

首先,您需要在计算机上安装python。安装python很简单。您只需转到官方python下载页面并下载安装程序。下载安装程序后,运行它,并确保将其添加到环境变量中。如果您不知道如何执行此操作,这是一个有用的视频指南。

安装power bi

这一部分显而易见。要将python集成到power bi中,您需要安装power bi。对于本演示,我们将使用桌面版本。首先,访问官方power bi下载页面并下载桌面版本。

下载完成后,运行安装程序,并接受默认设置。

安装pandas和matplotlib

power bi需要两个额外的库来处理数据集并在python中创建可视化效果。这些库是pandas-一个数据处理库,和matplotlib-一个数据可视化库。要安装pandas,请打开命令提示符并输入以下命令:

pip3 install pandas

接下来,在命令提示符中输入以下命令来安装matplotlib:

pip3 install matplotlib==3.7

启用python脚本

最后一步是验证python脚本已启用。为此,从power bi功能区中选择文件部分。

接下来,从菜单中选择选项和设置选项。

在选项菜单中,转到python脚本部分,并验证你的python安装文件夹是否列为python文件夹。

就是这样,你已经将python集成到power bi中。接下来,我们将探讨如何使用它。

如何在power bi中使用python

导入数据

要导入数据,首先从功能区中选择获取数据选项。

在弹出菜单中搜索python并选择python脚本选项。

在出现的脚本输入中输入以下创建小数据集的python代码。

import pandas as pd

sales = pd.dataframe({
    'month': ['january', 'february', 'march'],
    'value': [124000, 240000, 180000]
})

接下来,我们将使用python在power bi中创建可视化。

创建可视化

我们将创建一个简单的折线图,显示刚刚创建的数据集中的三个月的销售情况。

要创建可视化,首先从power bi右侧的可视化面板中选择python选项。 python选项仅标有py。如果它不会立即出现,请点击三个点以查找它。

点击后,您应该得到一个提示,询问是否要启用脚本可视化。您将接受它,以便可以编写python可视化。

之后,将月份和值字段从右侧的数据面板拖动到可视化面板,即即将出现在数据面板左侧。这样做将使您可以在创建可视化时使用的数据。

接下来,您应该在底部看到一个类似于此的脚本编辑器部分:

在此脚本中,我们可以访问数据集对象-它是一个包含列“月份”和“值”的pandas dataframe。脚本还自动删除重复值。即使被注释掉,注释代码也总是被执行的,所以我们不必对其做任何处理。

为了使用matplotlib创建可视化,我们编写以下代码:

import matplotlib.pyplot as plt
dataset.plot(kind='line', x='month', y='value', color='blue')

plt.show()

这将从数据集创建一条折线图。 x轴将包含月份,而y轴将包含值。线的颜色将是蓝色。

接下来,点击脚本编辑器右上角的运行按钮,您应该会在屏幕上看到一个可视化。

就是这样!我们能够在power bi中使用python创建可视化。可以使用matplotlib文档来扩展此示例以创建不同的可视化。

共享和重用代码

使用python创建可视化的优势之一是可以在多个项目之间共享创建可视化或导入数据所使用的代码。这使得您可以通过重用先前报告中的代码快速生成新报告。

虽然我不知道在power bi中有没有内置的数据共享机制,但是老式的复制粘贴应该可以在这里使用。虽然有点繁琐,但比使用内置可视化工具从头开始创建可视化要好。

power bi中python集成的局限性

虽然将power bi与python集成具有一些优势,但也有一些限制需要注意。这些包括:

  • python集成需要特定版本的python、pandas和matplotlib。如果使用不同的版本,可能会导致错误。因此,确保适当的依赖管理以防止错误非常重要。
  • 并非所有的python库都受支持,这意味着在power bi中编写脚本时可用的python库有限。
  • 运行来自不良操作者的脚本的风险。应该谨慎对待从在线获取并在报告中使用的脚本,因为这些脚本可能有害。

用例

power bi与python结合可用于执行许多任务。这些包括:

  • 创建机器学习分析应用程序
  • 创建可视化和实时仪表板
  • 以更复杂的方式转换数据

最后的话

在本文中,我们探讨了如何通过与python集成来增强power bi的功能,power bi是一款流行的商业智能工具,而python是一种流行的用于数据分析等用途的编程语言。我们还介绍了这种实现的好处和局限性。我们还介绍了这种实现的常见用例。

接下来,查看python中matplotlib的简介。

类似文章