首页 网站首页 商业资讯 数据 查看内容

数据可视化:深入浅出BI

社群管理 数据 2023-2-12 15:39 7607人围观

本文是《若何快速成为数据分析师》的第六篇教程,假如想方法会写作初衷,可以先行阅读七周指南。温馨提醒:假如您已经熟悉BI,大可不必再看这篇文章,或只挑选部分。

我们上一篇《数据可视化:打造高真个数据报表》教大师若何建造清楚美妙的报表以及响应技能,可是报表是成果的显现,并不是数据分析的进程。

数据分析师更多用到的报表是BI。

BI全称贸易智能(Business Intelligence),在传统企业中,它是一套完整的处理计划。将企业的数占有用整合,快速建造出报表以作出决议。触及数据仓库,ETL,OLAP,权限控制等模块。

明天的进修我们侧重于数据分析进程,利用Power BI打造数据分析师Dashboard报表。为了更好的进修和理论,我们照旧会利用《Excel实战篇》的数据停止操纵。这是做出的简单作品。



数据下载,提取密码 6x2v 。

Power BI在微软官网有下载(注不注册无所谓的),Power BI | 互动数据可视化 BI 工具,只需要下载Desktop桌面操纵版,巨细约120MB。临时只推出Win版本。

大师假如鄙人载进程中出现CAB文件损坏毛病,大如果某软哪方面又出错了,可以换阅读器下载,也可以下载中文繁体版。Microsoft Power BI Desktop。归正我是一向报错。

什么是Power BI

BI工具首要有两种用处。一种是操纵BI建造自动化报表,数据类工作天天城市打仗大量数据,而且需要整理汇总,这是一块很大的工作量。这部合作作可以交给BI自动化完成,从数据规整、建模到下载。

别的一种是利用其可视化功用停止分析,BI的优点在于它供给比Excel更丰富的可视化功用,操纵简单上手,而且美妙,假如大师天天作图需要两小时,BI会收缩一半时候。

BI作为企业级利用,可以经过它毗连公司数据库,实现企业级报表的建造。这块触及数据架构,就不深入讲了。

Power BI是微软家的。假如大师熟悉Excel,应当会晓得微软推出的Power Query、Power Pivot、Power View和Power Map,是Excel上很是强大的四个插件。Power BI则是微软将它们作为调集推出。

Power Query是用于数据提取、整合、搜索的插件。它偏向数据模子的建立,而不是单元格的利用。

Power Pivot是数据透视表的高级利用,利用DAX能停止大量的科学计较。性能方面,比Excel函数要快两个量级,百万级的处置不成题目。

Power View是图表的高级利用,实现了过滤、联动、拖拽等功用。

Power Map是可视化舆图。

假如大师熟练把握以上四个插件,那末在Excel上也能实现部分BI。究竟Excel是企业中人手一款的工具,和BI相比有轻量级的益处,虽然数据分析师需要把握的工具更多。


BI的步调

市道上有很多丰富的BI工具,Tableau,QlikView,BDP等,各有偏重,也各有价格。可是操纵进程都是类似的,大致分为五个步调:数据源读取、数据清洗、数据关联、图表建造、Dashboard整合。熟悉了其中一个,再学会别的的就不难。

由于我工感化的BI是私有化摆设到办事器,间接毗连生产情况的,演示不方便。所以才用Power BI演示,现实我也说不上熟练。

数据源读取

我们翻开Power BI,它会让我们登录,不用管它。



界面和Office软件比力接近。上面是操纵工具项,左侧栏是导航栏。

Power BI 的左侧导航栏对应三个模块:仪表板、报表和数据集。仪表板或报表需要数据才能操纵,我们先读取数据集。

点击工具栏的获得材料(希奇的翻译)。



Power BI支持各类丰富数据源(市道上绝大部分BI都支持,只是读取方式略有差别),除了Excel和CSV 文件,它还支持Acess、SQL数据库、Hadoop/HDFS、Spark、第三方API等。

这是新手教程,毗连CSV即可,挑选载入练习数据DataAnalyst。



这里可以针对数据编辑,先略过,挑选载入。

自动跳转到数据报表页,数据报表(Report)是数据规整和清洗进程。

大师还记得实战篇中演示的数据清洗吗?之前我们体验了一遍Excel函数清洗的进程。此次需要用BI再停止一遍清洗。数据清洗是分析师最蛋疼且耗时持久的工作,没有之一。

数据清洗

Power BI有一个高级功用叫DAX(Data Analysis Expressions),它是全部 Power BI 利用的公式说话。

DAX近似Excel函数(大大都第三方BI,函数均接近Excel),故它针对新手很是友爱。假如大师已经熟悉Excel函数,上手速度会很快。根基上函数名字都一样,假如不熟悉,可以查阅官网供给的文档。

我们先清洗报表中的薪水salery,和实战篇进程一样,需要将其拆分红两个新列,而且计较均匀值。



点击模子项的新建材料行(这里的翻译应当差池,应是column列,后文我都用列暗示),此时新增加的列没有任何内容。我们需要做的操纵就是以salery天生两列。



这里需要用到DAX。当做函数利用它就行,不外Excel是单元格级此外援用,而DAX中的任何援用、计较、汇总等,都是以列为单元的。

='Table Name'[ColumnName]

这是最简单的援用,Table Name是我们这张报表的名字,我载入的csv叫DataAnalyst,那末报表就叫做DataAnalyst,ColumnName是我们需要援用的列,名字叫做salary。下图公式就是典范。



假如表名中有空格,需要加引号,假如没有则不需要。假如是跨表援用,TableName是必须的,否则只需要ColumnName。DAX支持自动添补,可以经过模糊输入+回车快速输入。

我说过它近似Excel,那末Excel加减乘除的习惯可以间接利用在上面。

='Table Name'[ColumnName1]+'Table Name'[ColumnName2]*3

接下来继续清洗步调,我们查找k地点的字符串位置。

=search("k", DataAnalyst[salary],1)

操纵left函数截取人为下限。

=left(DataAnalyst[salary],search("k", DataAnalyst[salary],1)-1)

搞定。材料行重命名为bottomSalery

接下来是人为上限topSalery,利用"-"截取的时辰报错了。

=search("-", DataAnalyst[salary],1)

检查一下发现本来是有“10K以上”这类字符串。DAX查找不到“-”,这时需要返回一个出错时表达的值。由于10k以上的描写没法肯定人为上限,那末我们就把返回的值限制为bottomSalery。

在这里请记着,DAX的容错性比Excel低,只要DAX中有一行返回Error,那末整列都是Error。我们需要用Iferror函数保证容错性。

这里给出topSalary的计较,比力烦琐。

topSalery = IFERROR(mid(DataAnalyst[salary],SEARCH("-",DataAnalyst[salary],1)+1,LEN(DataAnalyst[salary])-SEARCH("-",DataAnalyst[salary],1)-1),DataAnalyst[bottomSalery])


以后新建一列利用(DataAnalyst[bottomSalery]+DataAnalyst[topSalery])/2 计较该岗位的均匀人为。

大师看到这里,能否是感觉DAX公式很是长?新手可以多增加帮助列来停止计较。

Excel中有比力方便的排列功用,那末Power BI中能否具有呢?答案是必定的,右键点击列,挑选编辑查询选项。



这里照旧吐槽翻译。朋分材料行就是我们熟悉的排列功用。挑选自界说,用“-”即可完成份列(原始数据会被拆分,所以倡议先复制一列)。



实战篇提到过,我们的北京数据是有反复值的,那末我们经过positionId这职位的唯一标示,来删除反复项。右键点击移除反复项目即可。

我们再看一下查询编辑的其他功用。

分组根据可以以为是数据透视表。可以挑选多个字段停止分组。对成果停止求和、计数等操纵



假如是定单、用户行为、用户材料等大量数据,一般会以分组形式停止计较。分歧分组字段,会天生分歧的维度,像典范中的城市、工作年限,教育布景都是维度,也是图表的根本。假如天生的维度充足多,我们能操纵维度组成数据模子,这是OLAP的概念。

除此之外,也能操纵过滤间接挑选数据。我们挑选出含稀有据分析、分析的数据。解撤除大数据工程师等干扰职位。



这里支持多条件复杂逻辑挑选。

到这里,我们已经完成实战篇中的清洗进程中,我此次简单化了。以上步调都能经过右侧的套用步调复原和撤消。这里不会出现bottomSalery这类列。


以后挑选工具栏的封闭并套用,报表数据就会更新。最初数据2300多行。


经过数据查询和报表DAX公式,我们就能完成数据清洗和规整的步调。首要思绪是:移除反复值、过滤方针数据、清洗脏数据、数据格式转换。

数据关联

我们工作中会用到很大都据,不成能依靠一张表走全国。如果在Excel中,我们经常用Vlookup函数将多张表关联汇总。Power BI则用拖拽关联数据,更方便。通常为先关联再清洗。

由于我的数据只要一张表,用不到关联,以官网截图为例。



很简单,用拖拽将Product的manufactureId和Manufacturer的manufactureId关联,我们可以了解成做了vlookup援用,也可以想成SQL的Join。

分析会触及到很多复杂身分,这些身分相关的数据不会安恬静静给你呆在一张内外,而是分歧的表,所以需要用到数据关联。

数据关联在进修到SQL后会加倍清楚,这是SQL的焦点概念之一。


图表

进入图表设想阶段,点击侧边栏第一个项。BI比Excel好的地方在于,它只要拖拽就能设想和天生。



点击任一图表,画布上会自动天生图形,要切换图表范例间接点击其他即可。我们把城市和均匀人为拖拽到视觉结果下的栏目,它会自动天生图表。分歧图表需要的维度、轴都纷歧样,具体按提醒停止。



视觉结果下有设想选项,可以将图表调剂的更美妙,这里不具体先容了。

点击新增视觉结果(继续吐槽翻译),可以继续在画布上增加图表。绝大部分BI,都是支持联动的,所谓联动,浅显讲,就是点击图表上的维度元素,其他数据也会按此维度响应变化。



上图就是一个很好的联动例子,点击城市维度的北京,其他图表都变了,均匀人为由14.23酿成15.23。而学历则酿成突出显现,显现出了北京的博士们薪水远高于均匀水准。

图表联动带来更好的数据洞察,将分歧数据维度的组合和拔取,为分析师带来决议才能的提升。固然我最喜好的特点之一是省时候。

经过不竭的图表组合,就能天生数据分析师自己的分析画布。这块画布叫作Dashboard。固然图表都雅与否,就取决于分析师的设想品味了(这个我教不了你们,哈哈)。



假如维度过量,大师可以插入视觉选项中的穿插挑选器,增加过滤功用,常用于邃密化的分析,例如时候维度。图表右上角按钮,还能挑选导出数据,导出一份该图表的csv数据。

我们也能将其公布到网上,作为同事和企业间合作,大概手机端阅读数据用。固然这里需要注册账号,就看大师志愿了。

更多功用留待大师进修,到这里,Power BI的新手教程就竣事了。我罗列了常用的功用,不晓得大师有没有从Excel图表水平跃升到一个新阶段,大师可以自己拿数据做图表报告作为分析师行业的拍门砖。假如还有疑问,就借助官网文档进修,BI作为一个范畴,它值得数据分析师深入。

以下是一些补充:


典范

由于时候的关系,我没有讲授更多的款式设想内容。大师可以去官网下载典范,含有原始数据练习。主如果进修他人的报表汇制思绪。



别的Power BI的图表偏少,类似标靶图、箱线图都没有。不外官网有各类图表下载。搜索pbiviz即可,没有中文。



R集成


Power BI在它内部已经集成了R说话,没错,就是统计学中的R说话。假如你感觉视图功用还不够强大,那末我们可以操纵R来绘制图表,甚至借助R做回归分析等。固然R是第七周的内容。这里只以官网截图为例。



数据更新

BI很重要的一个功用是数据更新,它是报表自动化的根本,它凡是和SQL关联。我们利用CSV,只能往里面黏贴数据更新,还是烦琐了些,只属于半自动化。这将在学会SQL后处理。


————————

接待大师关注我的微信公众号:tracykanc

定期分享运营或数据的内容

高端人脉微信群

高端人脉微信群

人脉=钱脉,我们相信天下没有聚不拢的人脉,扫码进群找到你所需的人脉,对接你所需的资源。

商业合作微信

商业合作微信

本站创始人微信,13年互联网营销经验,擅长引流裂变、商业模式、私域流量,高端人脉资源丰富。

我有话说......
  • 462710480 2023-2-12 15:49
    秦老师你好,在作图的时候怎样调出“值”里avgsalary的平均而非计数。打开就是计数。
  • 动动省 2023-2-12 15:49
    公众号文章上Top Salary 的计算公式非常实用Top Salary = IFERROR(MID(DataAnalyst[salary],SEARCH("-",DataAnalyst[salary],1)+1,LEN(DataAnalyst[salary])-SEARCH("-",DataAnalyst[salary],1)-1),DataAnalyst[Bottom Salary])
  • quanquan. 2023-2-12 15:48
    微软的power bi 桌面版不能下了吗?现在
  • 万胜 2023-2-12 15:48
    mac用什么啊 power BI用不了啊
  • 美业私域运营 2023-2-12 15:48
    在图表设计的时候,选择了city和avgsalary,但是图表提示“无法显示该视觉对象”,不知道具体是什么原因导致的,网上也没有收到太多的解决办法。求助一下。
  • aa66aa 2023-2-12 15:47
    你复制到后面一列呗

查看全部评论>>

相关推荐

各领域公开数据集下载

各领域公开数据集下载

整理了网上的公开数据集,分类下载如下,希望节约大家的时间。1.经济金融1.1.宏观经济

快速找到论文数据的19个方法

快速找到论文数据的19个方法

在这个用数据说话的时代,能够打动人的往往是用数据说话的理性分析,无论是对于混迹职

有哪些可以获取数据的网站?[大数据]

有哪些可以获取数据的网站?[大数据]

做数据可视化或者数据分析的朋友可能经常会碰到的问题就是有想法没有数据。想到我有几

Detectron2训练自己的数据集手把手指导

Detectron2训练自己的数据集手把手指导

Detectron2训练自己的实例分割数据集This article was original written by Jin Tian,

数据增强(Data Augmentation)

数据增强(Data Augmentation)

我们常常会遇到数据不足的情况。比如,你遇到的一个任务,目前只有小几百的数据,然而

数据迷思2:辛普森悖论下的香港死亡数字

数据迷思2:辛普森悖论下的香港死亡数字

如果有两名篮球手A和B,本来,无论是两分球还是三分球,A都要比B投得准,但是一个赛季

数据看中国vs世界:2021世界各国/地区薪资排名

数据看中国vs世界:2021世界各国/地区薪资排名

数据源:NUMBEO自从我的“randy77:数据看中国vs世界:2020年世界各国人均GDP最新排名

数据可视化:打造高端的数据报表

数据可视化:打造高端的数据报表

本文是《如何快速成为数据分析师》的第五篇教程,如果想要了解写作初衷,可以先行阅读

最通俗易懂的理解什么是数据库

最通俗易懂的理解什么是数据库

1.什么是数据库呢?每个人家里都会有冰箱,冰箱是用来干什么的?冰箱是用来存放食物的

数据可视化:深入浅出BI

数据可视化:深入浅出BI

本文是《如何快速成为数据分析师》的第六篇教程,如果想要了解写作初衷,可以先行阅读

数据分析师这个岗位,可能近几年会消亡

数据分析师这个岗位,可能近几年会消亡

近期成为月入两万的数据分析师的广告遍地都是,可能会对一些未入行的同学造成错觉。我

没数据分析项目经验,找工作也别太慌!

没数据分析项目经验,找工作也别太慌!

1. 你问不少同学加了微信,第一句往往类似这样: 在校或刚毕业的学生,没有实习经验,

Excel函数公式大全(图文详解)

Excel函数公式大全(图文详解)

我把每个函数的中文名都制作成了目录,通过目录能够快速定位到相应的函数。如果这篇文

18个超实用的神级免费网站,找论文和文献必备!

18个超实用的神级免费网站,找论文和文献必备!

写论文至关重要的一步就是查文献,为了让小伙伴们能够在查文献的路上少走弯路,顺利写

30个值得推荐的数据可视化工具(2020年更新)

30个值得推荐的数据可视化工具(2020年更新)

30个数据可视化工具(2020年更新)目录摘要• 零编程工具◦ 图表(9个)◦ 信息图(2

从三次人口普查的公开数据看兵源人口的变化与“征兵难”问题 ... ...

从三次人口普查的公开数据看兵源人口的变化与“征兵难”问题 ...

最近很多人私信询问如何看待出生人口或人口总量减少对征集兵员和国家安全的影响。这可

数据看中国VS世界:世界各国人类发展指数排名-2020

数据看中国VS世界:世界各国人类发展指数排名-2020

人类发展指数:Human Development Index(HDI),是联合国开发计划署从1990年开始发布

GIS数据免费下载网站

GIS数据免费下载网站

刚学习GIS和RS的同学肯定很困惑于数据的问题,因为没有数据,就没法分析,那么GIS最基

2022新数据出炉:透过性别比例与出生人口,我看到两个残酷的现实

2022新数据出炉:透过性别比例与出生人口,我看到两个残酷的现实

2022重磅数据公布,全年出生人口956万人,死亡人口1041万人。从性别构成来看,男性人

数据中台(一)什么是数据中台

数据中台(一)什么是数据中台

本文从数据中台的定义、核心能力、优点出发阐述企业数据中台建设的意义与必要性。一、

TA还没有介绍自己。

最近内容

电话咨询: 15924191378
添加微信