All 必须码住的系列 | Power BI最佳实践的十大秘密武器(第3部分)

​在这个由四部分组成的系列文章的前几部分中,我们列出了十大性能优化的提示,这在一定程度上所提供的Power BI解决方案肯定会帮助你减少内耗,更快地工作,并为报表使用者提供更好的报告体验。但如果你还不知道,请一定要查看我们的前两篇文章哦。

现在,我们已经通过前面的所有技巧控制了性能因素,现在也是时候回顾一下Power BI的10大最佳实践技巧了。

确保分享的Power BI解决方案尽可能与最佳实践保持一致,意味着要:

1.    降低错误发生的风险

2.    构建易于管理的解决方案

3.    首次尝试就正确的解决方案

4.    实施用户友好的解决方案

5.    构建可长期扩展的Power BI解决方案。

那么,让我们从前5个最佳实践技巧开始第3部分。

提示1 用显式度量,不是隐式度量

 

简而言之,隐式度量是自动为汇总分配的度量,例如Power BI的Sum或Count。当我们将数据提取到Power BI中时,默认情况下,所有可以汇总的数字列,都是隐式度量。我们应该将所有这些隐性度量转换为显性度量。首先,通过下面的示例,可以确保我们都了解隐式度量是什么。

什么是隐式度量?

我们进入Power BI Desktop,开始创建可行的,美观的,有价值的分析报告。因此,我们要做的第一件事是将数据提取到Power BI中。完成此操作后,我们将在“字段”窗格中找到我们提取的所有表,如下所示。

在“Fields”(字段)窗格中,我们有一个称为Sales的事实表,以及两个维度(查找)表:Date和Geography。在“销售”表中,我们具有从数据源提取的所有列,并注意在“销售”和“销售成本”旁边有SIGMA(∑)符号。这意味着这些度量是可以汇总的数字列;因此我们可以将其用于算术计算。这些就是我们所说的隐式度量。但是为什么这些是隐式度量呢?好吧,我们继续将“销售”属性拖放到画布上,然后单击“值”部分中“销售”列的下拉箭头,如下图所示:

请注意,从上图中可以看到,Sales度量标准自动分配了Sum聚合器,可以将其更改为Average,Maximum,Count等。这就是为什么我们将其称为隐式度量标准的原因,因为我们没有直接说明聚合类型分配,但Power BI默认选择它。

为什么我们要将隐式度量转换为显式度量?

即使在这种情况下,销售汇总是正确的,也有可能在下一次将其显示为Count时出现。这可能导致报表作者感到困惑,并导致报表使用者报告错误的数字。另外,如果你的报表使用者正在使用“在Excel中分析”功能,则不能在值部分中放置隐式度量。此外,我们不能在其他度量中引用隐式度量,并且隐式度量的名称并不总是很容易理解。所有这些原因就是为什么我们应该通过将所有隐式度量转换为显式度量来明确声明要使用的聚合的原因。

我们应该如何将隐式度量转换为显式度量?

为此,我们只需要创建一个具有预定义聚合的度量,如下所示:

因此,如果我们现在将显式度量“ Sales Amount”拖放到画布上,请注意我们得到的结果与隐式度量相同,但是我们不能再为此度量选择聚合器。

 

提示2 按组整理度量

 

第二个技巧与上面解释的技巧是相辅相成的,因为在我们生成显式度量之后,我们应该如何处理所有剩余的隐式度量?如果它们不可见,它们肯定会使报告作者困惑。此外,如果我们将数据模型构造为星型模式,则每个事实表都将包含一些外键,以与维度(查找)表中的主键,建立关系。那这些列是否应该对所有人可见?

在Power BI中,我们可以轻松地将度量和列分组到文件夹中,因此使我们能够保持整洁的解决方案,并且仅向报表作者显示应在报表中使用的度量和列。下图显示了在我们对Power BI解决方案进行分组之前和之后的所有字段。

对于所有事实和维度表,我们应遵循的一般标准是:

每个维度表应包含一个文件夹:

主键:维度(查找)表中的所有PK都应放在此处并隐藏。

每个事实表应包含两个文件夹:

外键:事实(数据)表中的所有FK都应放在此处并隐藏。

隐式度量值:从源导入的所有度量值都应放置在此处并隐藏。

提示3 使用正确的连接类型

 

在Power BI开发过程中优先考虑正确的连接类型很重要,因为这会影响:

  • 性能

  • 资源使用

  • 能力

此外,一旦选择了连接类型,就无法将其转换为另一种类型,除非要将Direct Query转换为Import,因此从一开始就做出正确的决定可以帮助我们节省一些时间。

现在,我们将不再深入探讨各种连接类型的细节,如果你想要了解一些关于Power BI连接类型,大家可以留言,这里温馨提醒下:简要说明我们应该问自己的问题,以确定哪种连接类型最合适。请记住,这仅是一个指南,因为根据业务环境和报告要求,它可能会发生变化。

是否存在现有的AS模型或Power BI数据集?

我们应该利用现有的Analysis Services模型或Power BI数据集,其中包含我们需要报告的所有数据。当时间和资源已经投入到工作上时,为什么还要重做所有工作。此外,在企业场景中,建议使用一个来源作为所有报告示例模板。

我们是否需要从多个来源提取数据?

以前,如果我们需要从多个不同的源中提取数据,则“导入”连接类型是唯一的选择,但是由于复合模型开始发挥作用,因此不再如此,因为我们可以使用“混合”连接类型。话虽如此,但如果你只需要从多个源中获取数据并且没有其他限制或要求,导入仍然是你的最佳选择。

是复杂的转换还是DAX?

根据所选的连接类型,功能上存在一些限制。因此,如果我们需要复杂的转换或DAX来将某些业务逻辑整合到Power BI解决方案中,则应使用Import,因为Power BI的全部功能都可用。

我们需要近乎实时的数据吗?

如果我们需要数据接近实时,因此需要在报表使用者与报表交互时进行刷新,那么Direct Query是必经之路。Direct Query建立了与基础数据源的连接,因此,每次用户与Power BI中的视觉交互时,都会生成查询,并将其发送到基础数据源,并返回要呈现的数据。这与“导入”连接类型(有时称为“计划的”连接类型)相反,因为它需要在更新数据之前计划刷新。

我们是否需要提取大量数据?

过去,即使Premium没有Power BI Pro许可附带的1GB限制,我们也无法处理非常大的数据集。当将复合模型引入Power BI时,它带有混合连接类型,该类型可以获取新数据量到Power BI中。因此,如果你有非常大的事实表,则可以将这些表设置为Direct Query,并且可以将所有维度(查找)表设置为导入,因此可以使用混合连接类型。

提示4 使用关于页面

我们的Power BI报告的设计可以使其与数据可视化的最佳实践保持一致。但是,我们应该结合的另一个要素是关于页面。这将为报告使用者提供报告目的的高级概述,以及BI团队通常会提出的常见问题的答案。

坚持一下,如果你精心设计和开发了报告,是否需要这样做?

是! 你可能从一开始就遵循了正确的过程,即收集需求启动研讨会,确定合适的受众,得出可行的KPI并创建美观且可行的Power BI报告,但是关于页面提供了即时的见解和理解, Power BI报告将展示。

我们可以添加到“关于”页面的信息如下:

  • Power BI报告的目的和说明

  • Power BI报告的所有者

  • 链接到提供定义/术语的数据字典

  • 上次刷新和刷新频率

  • 重点介绍如何使用各种功能的部分

那么,有什么好处呢?

不要忘记,Power BI报告的受众有时需要对核心概念进行复习是很普遍的。此外,新人们将加入该组织,并具有关于页面的内容作为快速入门指南。这也缓解了BI团队的压力,因为它回答了常见问题,并且可以消除报告中使用的各种度量的定义和描述性属性中的任何歧义。

 提示5 重命名并减少转换步骤

Power BI中的数据转换是通过Power Query组件完成的,该组件用于所有数据转换和数据整形操作。对于那些不熟悉Power BI的用户,只需选择Power BI Desktop桌面功能区中的“转换数据”按钮即可轻松访问Power Query,如下所示:

现在,当使用具有更复杂业务逻辑的大型PBIX文件时,转换步骤的列表往往会更长。使用Power BI时,通常的做法是为每个步骤分配不言自明的名称,并删除可以合并在一起的所有多余步骤。一目了然,可立即了解每个步骤,并减少混乱。

什么是转换步骤?

这只是Power BI解决方案中已应用的转换的列表,这些转换显示在名为“ 应用步骤”的右侧面板中。这是Power BI的一项重要功能,它使我们能够轻松了解所有已应用的转换,引用先前已应用的转换并轻松还原。

重命名转换步骤

如果我们在“应用步骤”面板中查看以下转换步骤,则应该立即注意到可以进行的改进。我们使用的默认名称并没有提供太多了解。

 

相反,我们应该重命名每个步骤,以便为可能需要继续使用Power BI解决方案的个人提供即时清晰的信息,或者为了在长时间后返回Power BI解决方案时为了方便我们自己。

重命名每个步骤之后,我们现在应该具有一个转换步骤列表,这些转换步骤可以立即清晰显示,如下图所示:

减少转换步骤

除了重命名所有步骤之外,我们还应致力于减少转换步骤的数量。因此,让我们继续上面的示例。对于每个派生的列,我们都有一对转换步骤。一个派生实际列的转换步骤,另一个重命名列的步骤。在这种情况下,我们可以将这两个转换步骤结合在一起。

例如,当我们选择“ Custom Colum”来派生一列时,我们还应该利用同时命名该列的优势,而不是生成第二个转换步骤:

这样做不需要第二步来重命名自定义列,因此将转换步骤从10减少到5:

这就是前5个最佳实践技巧的全部内容。希望大家喜欢这些技巧,这些技巧必将有助于创建Power BI解决方案,从而降低错误风险,更易于管理并且更加用户友好。请继续关注第4部分,和我们一起探索后5个Power BI最佳实践技巧吧。

推荐阅读

Power BI性能提升的10大秘密武器(续)

Power BI性能提升的5大秘密武器

如何动态显示用户的报告页面

【2020】Power BI 6月产品功能更新

如何通过表格编辑器批量替换DAX的内容

 

技术交流

1.Power BI免费下载:http://www.yeacer.com/

    Microsoft Power BI Desktop中文最新版:下载地址

2.欢迎加入的Power BI技术群,目前正在学习阶段,有兴趣的朋友可以一起学习讨论。 

   Power Data技术交流群:702966126 (验证注明:博客园Power BI) 

   更多精彩内容请关注微信公众号:悦策PowerBI          


如果您觉得阅读本文对您有帮助,请点一下“推荐”按钮,您的“推荐”将是我最大的写作动力!欢迎各位转载,作者博客:https://www.cnblogs.com/yeacer/ 
原文地址:https://www.cnblogs.com/yeacer/p/13220632.html