信息图 (Infographic)
数据可视化
可视化
图表
图表工具

数据分析图表类型主要有哪些呢?

除了目前BDP中的30多种图表,还想要了解全部的数据图表类型~~~ [图片]
关注者
279
被浏览
683,985

66 个回答

我们做数据分析的有句话叫“一图胜千言”,图表是展现数据的一种重要展现形式,选对了图表就能帮助我们更加快速、直观的传达数据信息。

但是图表的种类繁多,应用场景不一,所以很多新手在进行数据可视化时,经常不知道什么样的图表来展示自己的数据才是最合适的。今天就按照对比关系的不同,来对图表进行分类介绍。希望大家可以及时找到最适合的图表。

最后分享一些BI建设、数据分析相关的优质资料:

  • 占比关系图表
  • 项目对比关系图表
  • 时间序列对比关系图表
  • 频率分布对比关系图表
  • 相对性对比关系图表
  • 位置对比关系图表

一、占比关系图表

1.饼图:饼图是一个划分为几个扇形的圆形统计图表,通常用来展现数据的分类和占比情况。比如想要突出表示某个部分在整体中所占比例,尤其该部分所占比例达到总体的25%或50%时。


2.环形图:展现数据的分类和占比情况,相比饼图,环形图的可读性更高,可以把重要数据放在中间


3.百分比堆积条形图:对比同一个分组数据内不同分类的占比,分组多


4.百分比堆积柱形图:对比同一个分组数据内不同分类的占比,分组少


5.矩形树状图:清晰地显示层次结构,通过矩形面积、排列的不同来展示层次内部的占比关系

二、项目对比关系图表

1.柱形图


2.条形图


3.堆积条形图:表示多个类别里的各构成的对比,表明组成整体的成分情况


4.旋风图:对比分类数据的数值大小,表明两个不同成分的特点,如进口百分比与出口百分比


5.范围条形图:表示多个类别间的由低到高的数值范围,而不是表示单个数值,适合用于表示多个类别间的数值范围间的比较。


6.词云:展现文本信息,对出现频率较高的“关键词”予以视觉上的突出


7.雷达图:将多个分类的数据量映射到坐标轴上,对比某项目不同属性的特点。了解同类别的不同属性的综合情况,以及比较不同类别的相同属性差异。

三、时间序列对比关系图表

1.折线图:展示连续数值(例如时间)或者有序分类的变化趋势


2.面积图:用面积展示数值大小。展示数量随时间变化的趋势。


3.垂直瀑布图:一般适用于汇报数量的增减,比如一年中各月销售额、用户数等指标的变化

四、频率分布对比关系图表

1.人口金字塔图(和上面的旋风图类似)


2.直方图:表达连续的区间上数量的分布


3.分布曲线图


4.箱型图

五、相对性对比关系图表

1.散点图:散点图通常用于显示和比较数值,不光可以显示趋势,还能显示数据集群的形状,以及在数据云团中各数据点的关系。


2.波士顿矩阵图


3.气泡图

六、位置对比关系图表

1.区域地图:区域图是对不同的区域划分分别进行区面着色展示的可视化类型


2.点地图:点地图图是把一系列离散的数据点按照位置信息标注在地图上。适合需要把大量具有相同属性的地址信息同时展示在地图上的业务场景。比如展示连锁店分布、加油站分布、银行网点分布等。


3.热力地图:热力图通过指定的半径范围进行数据叠加计算,然后与梯度颜色进行数据映射,不同的颜色深度代表不同的数据密度。通常适用于数据量比较多且在一定地域范围内相对密集的业务场景。

比如展示某个商圈的人流分布、某个景区的客流分布、某个区域的车流分布等。


4.流向地图:迁徙图是在两点之间绘制弧线进行连接,并配以动画呈现移动效果的图像,主要用于展示不同地点之间人员、物品、车辆等流动的方向。

说完图表类型,介绍两款我做可视化常用的工具,都很好上手,可以去试试。

第一款是专业报表工具 finereport,可视化的一大应用就是数据报表,而FineReport可以自由编写整合所需要的报表字段,进行报表输出,支持定时刷新和监控邮件提醒,是大部分互联网公司会用到的日常报表平台。最经典的一些应用比如公司体系的经营报表、日报周报等。推荐它是因为有三个高效率的点:

①可以完成从数据库取数(有整合数据功能)—设计报表模板—数据展示的过程。

②类似excel做报表,一张模板配合参数查询可以代替几十张报表。

③内置大量数字化大屏模板,更换数据可以直接使用。

第二款是零代码工具 简道云,如果你想找一个“简单易上手”的数据可视化工具的话,可以用简道云,其大屏看板没有那么精美,所以更加偏向业务侧的数据收集——统计——分析全流程

通过仪表盘,我们可以对表单收集的数据进行拉取,制作图表、形成数据看板,从而更多维度分析、展示,以数据指导下一步行动,职场人必备。

编辑于 2023-03-03 17:25

先看这张思维导图,能够帮助大家更快了解各类型图表的数据特点。

基于功能和属性:可将图表分为四大类,具体见下图:
基于使用场景,则可以分为两大类——日常需求、专业需求。

01 日常需求

先来看看日常工作生活中都会使用哪些图表,假设一个场景:几种水果的各个维度对比。

上面这个数据分析图表是用这个模板套出来的,按需自取>> 可视化仪表盘

(1)柱状图

柱状图是最常见的图表类型,也最容易解读。

它的适用场合是二维数据集(每个数据点包括两个值,即X和Y),但只有一个维度需要比较的情况。

例如,如下图所示的柱形图就表示了一组二维数据,【类型】和【单价】就是它的两个维度,但只需要比较【单价】这一个维度。

柱状图利用柱子的高度,反映数据的差异。肉眼对高度差异很敏感,辨识效果非常好。其局限在于只适用中小规模的数据集。

(2)折线图

折线图也是常见的图表类型,它是将同一数据系列的数据点在图上用直线连接起来,以等间隔显示数据的变化趋势。

同样结合上面额柱状图,我们加上折线表示【单价】就能很清楚的观察出价格的变化趋势:

折线图可以显示随时间而变化的连续数据(根据常用比例设置),它强调的是数据的时间性和变动率,因此非常适用于显示在相等时间间隔下数据的变化趋势。

(3)面积图

面积图与折线图类似,也可以显示多组数据系列,只是将连线与分类轴之间用图案填充,主要用于表现数据的趋势。

但不同的是:折线图只能单纯地反映每个样本的变化趋势,如水果的价格变化趋势;而面积图除了可以反映每个样本的变化趋势外,还可以显示总体数据的变化趋势,即面积,如下图所示:

(4)饼图

饼图虽然也是常用的图表类型,但在实际应用中应尽量避免使用饼图,因为肉眼对面积的大小不敏感。

例如,还是上面柱状图的同一组数据,使用饼图和柱形图来显示,效果就没有那么明显了:

一般情况下会用柱状图替代饼图。但是有一个例外,就是反映某个部分占整体的比重,这种情况下,饼图会先将某个数据系列中的单独数据转为数据系列总和的百分比,然后按照百分比绘制在一个圆形上,数据点之间用不同的图案填充。

另外饼图中还包含了圆环图,来表现一个数据在整体数据中的大小比例,详见 可视化仪表盘。

(5) XY散点图

XY 散点图主要用来显示单个或多个数据系列中各数值之间的相互关系,或者将两组数据绘制为XY坐标的一个系列。

散点图有两个数值轴,沿横坐标轴(X轴)方向显示一组数值数据,沿纵坐标轴(Y轴)方向显示另一组数值数据。

一般情况下,散点图用这些数值构成多个坐标点,通过观察坐标点的分布,即可判断变量间是否存在关联关系,以及相关关系的强度。

散点图适用于三维数据集,但其中只有两维需要比较(为了识别第三维,可以为每个点加上文字标示,或者不同颜色)。

(6) 雷达图

雷达图,又称为戴布拉图、蜘蛛网图。适用于多维数据(四维以上),且每个维度必须可以排序(国籍就不可以排序)。但是,它有一个局限,就是数据点最多6个,否则无法辨别,因此适用场合有限。

它用于显示独立数据系列之间及某个特定系列与其他系列的整体关系。每个分类都拥有自己的数值坐标轴,这些坐标轴同中心点向外辐射,并由折线将同一系列中的值连接起来,如下图所示。

需要注意的时候,用户不熟悉雷达图,解读有困难。使用时尽量加上说明,减轻解读负担。


02 专业需求

除了日常工作使用,还有一些专业性更强的数据分析图表,比如:

(1)热力图

以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示。可以直观清楚地看到页面上每一个区域的访客兴趣焦点。

但不适用于数值字段是汇总值,需要连续数值数据分布。

(2)矩形树图

展现同一层级的不同分类的占比情况,还可以同一个分类下子级的占比情况,比如商品品类等。适用于展示父子层级占比的树形数据。

但是不适合展现不同层级的数据,比如组织架构图,每个分类不适合放在一起看占比情况。

(3)甘特图

甘特图是项目/任务管理中非常常用的一种图表类型,通过活动列表和时间刻度表示出特定项目的顺序与持续时间。

甘特图参考模板>> 项目管理甘特图

(4)词云

展现文本信息,对出现频率较高的“关键词”予以视觉上的突出,比如用户画像的标签。适用于在大量文本中提取关键词。

不适用于数据太少或数据区分度不大的文本。

(5)漏斗图

用梯形面积表示某个环节业务量与上一个环节之间的差异。适用于有固定流程并且环节较多的分析,可以直观地显示转化率和流失率。

缺点是无序的类别或者没有流程关系的变量。

(6)瀑布图

采用绝对值与相对值结合的方式,展示各成分分布构成情况,比如各项生活开支的占比情况。适用于展示数据的累计变化过程。

局限:各类别数据差别太大则难以比较。

(7)桑葚图

一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,起始流量总和始终与结束流量总和保持平衡。比如能量流动等。可用来表示数据的流向。

不适用于边的起始流量和结束流量不同的场景。比如使用手机的品牌变化。

(8)箱线图

是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法。可用来展示一组数据分散情况,特别用于对几个样本的比较。

不足:对于大数据量,反应的形状信息更加模糊。


最后为大家整理了一份个图表的维度和注意点:

以上。

发布于 2022-07-28 11:48

干货预警,全文18666字,配图168张。涉及5种可视化表达类型、92课时,包含208个小知识点赶时间的知友,先点赞▲收藏★关注❤,有空回来复习。

《王者之星》Excel基础图表


在Excel上,可视化可分为5大类,光Excel基础图表就有16种,涉及的亚型或变形多达数百种。要学习完所有分析工具的图表制作方法是不可能的。


一、图表类型分类

但数据分析图表的原理都是相通的,通过学习某种工具的图表类型和制作方法,掌握常用图表类型的核心。一般图表分为:比较趋势分布/地理构成联系


下面就通过Excel这款工具,带大家系统认识图表类型和图表制作方法。

因为Excel的普及性高,图表自定义程度高。最近也系统整理Excel可视化的知识点,统一在这里跟大家分享一下。


本回答所有图表均为本人Excel作品,一起来看看Excel的作品是怎样的。

三维地图


三维地图


一键换色
数据看板:电商报表
数据看板:人事报表

E07.高阶的柱形图


E08.高阶的条形图


E09.高阶的折线图


E10.高阶的圆环图


接下来,系统学习Excel可视化:

二、图表元素的构成

商务图表一般有以下7种要素,分别是:logo图表、主标题、副标题、单位、图例、绘图区、备注

红色要素为系统原有要素棕色为需要自行添加的要素(视具体情况而添加)



以下就是使用各个要素的注意事项,给大家整理成表格,便于观看。

2.Excel图表三个重要选项

图表最重要的共同三个元素设置分别是:系列形状坐标轴数据标签。不同图表的这三个要素的选项有细微差别。



了解Excel图表的共性之后,接下来系统学习各种图表:


三、系统学习各种图表

1.柱形图:对比分析

柱形图是日常用得最多用于比较的图表,柱形图可以分为2类:二维柱形图三维柱形图。以下为使用注意事项:

01.用于少量数据对比,一般不超过8个数据系列
02.尽可能将数据进行排序,使得逻辑性更强
03.更柱形图展示功能类似有条形图、直方图



(1)系列选项

在柱形图、条形图等系列选项中,有系列重叠间隙宽度等设置,了解一下它们分别指代是什么?



系列重叠:同一类别下2个系列的重叠程度。

间隙宽度:是2个不同类别之前的间隙长度。



系列重叠、间隙宽度里面的100%等,参考是柱体的宽度为标准的长度单位1。



以下为一些特殊节点的图表表达形式。



(2)坐标轴选项

文本坐标轴选项:



日期坐标轴的选项:日期坐标轴选项比文本坐标轴选项,多了边界单位等设置。



不连贯日期的坐标轴:



只需要在【坐标轴选项】的坐标轴类型,由日期坐标轴改为文本坐标轴,即可呈现连贯的坐标轴。



2.条形图:对比分析

条形图在移动时代很常见,如进度条王者荣耀的战绩图等。

进度条
王者荣耀战绩图


条形图和柱形图的特点一样、仅仅在方向上,横竖的区别。


条形图的6种常见类型分别如下:



3.折线图:时间趋势分析

折线图一般用于根据以往变化,预测下阶段趋势。


折线图分为:带标记点的折线图,无标记点的分析2种情形。折线图的横坐标为时间居多,用来表示未来趋势分析。



数据量比较大的情况下,一般使用无标记点的折线图。



4.饼状图/圆环图:占比分析

饼状图和圆环图表示占比。


圆环图有日常的图表还有子母饼图,一般后面为同一系列下的内容我们才会使用子母饼图。



  • 在系列选项,饼状图有点分离设置
  • 在标签选项,饼状图有系统计算的百分比,无需手动计算其百分比。




5.面积图:占比趋势分析

面积图有6种常见的图表类型,横坐标轴一般为时间。

6.散点图:双变量分析



散点图是有2列数据,作图时选择2列数据,不要选上名称列。由于有2列数据,必须使用坐标轴标题




双变量散点图的相关性如下:




7.气泡图:三变量分析




三变量的气泡图,有三列数据,最后一个用气泡大小表示,同样需要标注坐标轴标题,否则容易混淆。



对比散点图,气泡的不同点是:可以显示负值气泡大小。




8.雷达图:多维度分析

在游戏中,综合能力评估是经常看到这样的雷达图。


游戏中的雷达图:




或者人力资源对员工进行一个综合评价考核等。



9.树状图:分级占比分析

树状图仅有一列数据列,其他均为名称分类类。



系列选项和标签选项,均无特殊设置。



10.旭日图:分级占比分析

旭日图和树状图的数据规格一样,仅有一列数据列,其他均为名称分类列。


11.直方图

直方图一般用于统计一堆数据分类,例如原来数据是这样的。为了更具体形象,我们就举例了一个小型公司的工资表。如下:



选中工资列数据,插入直方图



选中横坐标轴,设置坐标轴选项


分别设置【溢出箱】【下溢箱】,图表就会把<5000的,归为一类;>20000的归为另外一类。

至此完成了图表的制作,来看一下图表的信息。


  • 公司中收入<50006人
  • 工资在5-8千区间人数最多,有14人,占比48%
  • 该公司超过平均工资的仅有5人,占比17%。


选中图表的横坐标,在【下溢箱】和【溢出箱】或【箱数】、【箱宽度】这四个设置。


直方图还可以做出这样的



12.瀑布图:趋势分析

瀑布图数据源一列为日期,另外一列为数值,最后有数值汇总。



右击最后一列,设置为汇总列。数据正的和负,会用不同的颜色表示。


13.组合图:不同数量级对比

组合图一般是柱形图和折线图组合的图表居多,由于是多坐标轴,故需要使用坐标轴标题。



14.必学图表看板

必学图表看板,就是把所有基础图表,都拼合在一个工作表里面。合成后,图表的整体性更强。

我们可以通过,修改颜色,变成不一样的效果。


15.王者荣耀看板

通过上面的修改颜色、和添加数字面熟,增添光效,PNG等。可以做出王者看板。


经过这6章,一共53课时的学习,了解到五大可视化类型的基础图表表达方式。接下来是学习,图表的进阶表达方式。


E07.进阶的柱形图

里面的图表都是用到柱形图,利用柱形图的变形,或设置改成了跟柱形图有所区别的图表。柱形图的变形有人形图水桶图山峰图总分柱形图等多个图表。


E08.进阶的条形图

利用条形变形就可以做出漏斗图人口金字塔图滑珠图甘特图等图表



E09.进阶的折线图

进阶的折线图有:火柴图、线面柱形图、正负柱形图、阴影面积图、重点区域高亮图、双坐标图等等。


E10.进阶的圆环图


四、更丰富的数据表达类型

Excel除了Excel图表,还有REPT函数、条件格式、迷你图、三维地图等可视化方式。在这里简单给大家介绍一下。

(1)REPT函数

表达式:=REPT(text,number_times)

=REPT(重复文本,重复次数)

如:=REPT("|",100),表示100个丨拼成一个条形图。

注意重复文本要用英文状态下引用,该函数搭配playbill字体使用效果更佳,大家可以通过百度搜索下载该字体。通过具体的实例去实战吧~


1.选择适合的字体很重要,一般适合展示20至100的数据


2.超出部分可以统一除以某个整数,设置在适合的区间范围内。如图。

表达式:=REPT("|",C5/5)



3.由于❤★等字形图标比较大,一般适合展示10以内的数据


4.人口结构金字塔



(2)条件格式

条件格式是最方便的可视化形式,通过【开始】【条件格式】即可轻松对突出或特别的数据进行可视化,还有数据条色阶图标集等设置。






(3)迷你图

迷你图是在单元格里面展示的迷你图表,主要有柱形图、折线图、盈亏图,用于表示趋势的图表居多。


(4)三维地图

三维地图是Excel里面最惊喜的一个可视化,它原来是Power Map插件,在2016版本以后自带的功能。



作品1.2000-2019年中国各省GDP变化图表。


作品2.某连锁品牌酒店在全国各地开分店情况。


作品3.2017年台风天鸽路径(1713)


作品4.隔空撩妹纸,一起ღ( ´・ᴗ・` )比心


以上就是关于Excel可视化的全部内容要点,还有许多详尽的信息,下次抽空给大家补上。


五、更多可视化工具

了解图表类型,除了从我们日常工具出发,还可以留意一下出色工具或网站,就更容易拓展思路。例如除了Excel外,Power BI 的可视化类型更丰富,Echart的图表更全。


(1)Power BI desktop

Power BI也是微软出品的可视化工具,原来是基于Excel的三大插件:Power Query、Power Pivot Power View组成。它图表丰富、有第三方图表库,可在线分享报表。

可视化作品如下:


(2)Echart

网址: Apache ECharts

一个纯 Javascript 的图表库,可以流畅的运行在 PC 和移动设备上,为广大码农提供了可视化框架。它图表丰富、可以适用各种各样功能。


工具3:flourish网页

网址: flourish.studio/

这是一个国外的动态可视化网站,只需要导入数据,就可以实现一些超棒可视化效果,如下:





关于可视化图表暂时更新到这里,本回答从可视化1.图表类型→2.图表分类→3.图表要素→4.图表种类→5.可视化分类→6.可视化工具。简单带大家了解了图表可视化,如果大家还有哪些方面想了解,可以在评论区一起探讨。


如果你觉得有所收获,点赞▲收藏★关注❤一波, @运营菌 带你探索更多可视化知识。

发布于 2021-05-25 15:19

从智能腕表每天的健康数据,到微信支付宝和网购APP每月给出的收支账单……如今我们的生活早已离不开数据。作为一个建筑转码人,我在学习计算机知识的同时也接触了一些数据分析方面的技能(比如用机器学习写一个简单的垃圾邮件识别器)。随着国内建筑行业的持续下行,我在去年也回答过转行相关的问题: 我是一个建筑系的学生,以后想走建筑和互联网结合或者智慧城市的一个方向发展走,对自学软件有什么建议吗?

今天借着这个问题正好来回顾一下数据分析的图表类型,以及相关的软件资源。

数据分析图表的主要类型

数据分析图表是数据分析的重要工具,可以帮助我们更直观地理解数据,发现数据中的模式和趋势。以下是一些主要的数据分析图表类型:

  1. 柱状图和条形图:这是最常见的图表类型,用于比较不同类别的数值。
  2. 折线图:折线图用于显示数据随时间的变化趋势。
  3. 散点图和气泡图:这些图表用于显示两个或更多变量之间的关系。
  4. 饼状图和圆环图:这些图表用于显示各个类别占总数的比例。
  5. 箱线图:箱线图用于显示数据的分布情况,包括中位数、四分位数和异常值。
图源:https://www.edrawsoft.com/chart/choose-right-chart.html

当然数据分析图表的类型在今天已经远远多于上述范畴,甚至有一些兼具多种图表类型的新种类。对于数据分析小白来说,最难的在于想明白要用自己手头的数据传达什么,然后选取适合的图表类型来完成可视化。

图源: Extreme Presentation

基于数据表现出的特征和作图者的意图,主流的数据分析图类型又可以归类到相对宽泛的四个大类之下:

  1. 比较(Comparison):柱状图,箱线图,条形图,折线图,箱线图
  2. 分布(Distribution):散点图,柱状图
  3. 构成(Composition):柱状图,饼状图,条形图,折线图
  4. 关联(Relationship):散点图,气泡图

那么如何快速而系统地掌握从数据整理到数据可视化的这个流程呢?恰好知乎知学堂目前推出的数据分析3天实战训练营,就非常符合零基础小白业余低成本尝试的需求,目前价格低至0.1元,这不比网上那些动辄上百的课程来得划算?

关键是除了直播,还有作业练习,社群打卡,和在线答疑。这对于自学困难且自制力缺乏的人来说也未尝不是一个好的开端。

数据分析图的应用

那么什么是初级的数据分析应用?什么又是高级的数据分析应用呢?

对于初级的数据分析,用户甚至不需要熟练掌握软件的操作,而只需要负责数据的输入。

如今许多办公应用和在线平台已经整合了一些基本的数据可视化功能。比如使用问卷星来创建问卷调查,评估表,在线测评,网络投票等,可以在活动结束后自动整合出基础的饼状图和条状图。

图源:问卷调查_调查问卷_免费问卷调查_问卷星 (wjx.cn)
图源:问卷调查_调查问卷_免费问卷调查_问卷星 (wjx.cn)

但在职场环境中,也存在许多不公开的数据处理和分析场景。比如公司内部人力管理部门和财务部门需要持续追踪和评估雇员的工时产出和公司的资金流动,项目部门需要跟进项目进度控制时间和成本风险等等,像下图就是不太常见的项目甘特图,用以追踪项目进度:

图源:微软365_甘特项目规划器

其次一些电商公司对于产品销量,竞品销量,价格对比,以及销售策略等,也有着更深入的数据分析需求。这些庞杂的数据往往涉及多个表单的整合对比,或者是数据之间的同步链接。

图源:亚马逊2020精品调研表-竞品调研

这就要求使用数据工具的人不但要理解原始数据的类型,还要能通过准确精细的自定义操作来搭建更高效的数据处理流程,完成多类型甚至非常规的数据分析图表的制作。下图就是使用Power BI软件制作的一系列图表:从常规的柱状图和折线图,再到饼状图和世界地图的叠加,对于不熟悉这些数据分析软件的小白来说,自行摸索耗时且困难。

图源:Data Visualization with Power BI

数据分析工具/软件

那么看完了这些实际应用的场景,接下来就是给数据分析小白准备的一系列入门级资源。

这些工具大致分为这么三类:数据源,数据编辑器,数据可视化软件/平台。

数据源

海外数据源首推Kaggle,国内数据源首推国家统计局官网。

其他的数据源需要考虑具体的应用领域,但粗略来讲以下数据源还是值得新手去了解的,覆盖面相对较广,数据集也比较优质:

国内网站:

  1. 阿里云数据市场: 阿里云推出的开放数据平台,包含海量高质量的数据集,涵盖零售,交通,金融,政务等领域。
  2. 百度迁徙: 百度发布的人口迁徙数据,包含省内迁徙和省际迁徙的数据,更新频率高,数据量大,适合人口流动研究。
  3. 东方财富Choice数据: 包含股票市场,基金市场,银行,保险,期货等金融领域的结构化数据。

国外网站:

  1. UCI Machine Learning Repository: 是一个数据学习项目的集合,提供许多经典数据学习项目的数据集。
  2. data.gov: 美国政府数据开放平台,收集了美国几百个政府机构和组织的数据,涵盖经济,教育,能源,环境,交通等领域。
  3. data.europa.eu:欧盟委员会数据门户网站,提供来自欧盟各组织和机构的公开数据,内容广泛,更新频繁。
  4. datacatalogs.org: 一个数据目录搜索引擎,集成了许多国家和组织的公开数据目录,可以一站式搜索全球各地区的数据资源。

数据编辑器

  1. Excel: 这是最常用的数据编辑工具,可以方便地对数据进行排序、筛选、格式化等操作。Excel也支持数据的导入和导出,适合中小规模的数据处理工作。
  2. SQL: 用于存取和处理数据库中的数据,可以高效地查询、插入、更新和删除海量数据。掌握SQL可以从数据库中精准提取自己需要的数据。
  3. Python Pandas: 是一个Python数据分析库,提供高性能、简单易用的数据结构和数据分析工具。Pandas可以快速准确地处理和清理数据,适合中大规模数据处理工作。
  4. MongoDB: 是一个面向文档的数据库,支持海量非结构化数据的存储,查询效率高,扩展性强,适合存取大规模不规则数据。
  5. Hadoop: 是一个分布式存储和计算框架,支持海量数据的分布式存储和高效计算。可以解决单机无法处理的超大规模数据存储与分析问题。
  6. Spark: 是一个快速、通用、可扩展的大数据分析引擎。Spark提供高level的工具可以更加方便地对海量数据进行处理,支持SQL、DataFrame、Machine Learning和Streaming等。

数据可视化软件/在线平台

  1. Tableau: 一款商业数据可视化工具,功能强大,擅长大数据的分析与可视化,产出的图表美观精致,深受企业欢迎。
  2. Power BI: 微软推出的一套商业智能工具,包含数据可视化、dashboard 创建等功能,易于上手,价格亲民,也很受企业欢迎。
  3. Qlik: 一款强大的商业数据可视化与分析工具,擅长数据关联分析和交互式可视化,产出的报表和dashboard漂亮实用。
  4. SAS Visual Analytics: 一款商业软件,提供数据管理、报告、分析、预测建模与可视化功能,高级而强大,常见于大型企业中。
  5. Matplotlib/Seaborn: 这两个Python库提供了丰富的绘图功能,可以制作精美的统计图形和信息图表,适用于学术和商业场景中的数据可视化需求。
  6. D3.js: 一个JavaScript库,支持交互式数据可视化,可以绑定数据到文档对象模型中,从而渲染动态的图表与界面。功能强大,需要一定前端技能。
  7. FineReport: 一款开源企业级BI商业报表软件,功能全面,支持多种数据源,能快速产出各种报表,面向中小企业用户。
  8. Datawrapper: 是一个在线平台,可以在网页上创建各种交互式图表,操作简单,无需编码,可以在非商业个人项目中快速实现数据可视化。

当然,我们只需要熟练掌握上述一到两种数据工具就足以完成分析图表的制作,这就取决于使用者具体的需求了。上述工具中提到的Excel,SQL,Python,Tableau,Power BI都有机会在知乎知学堂的实战训练营和后续正式的数据分析课学到,心动不如行动吧!

结语

通过列举上述软件和平台,我们不难发现如今市面上的数据分析工具十分繁杂,这意味着初学者想要独自摸索不但时间成本高且容易迷失。对于想要转行或者快速掌握数据分析技能的人而言,如果有机会能系统性地学习那还是值得尝试一些入门级的实战课程。

希望各位都能借助数据分析探索出属于自己的职业发展道路!

编辑于 2023-06-14 03:29

分享数据分析「50个」最有价值的图表python实现代码、使用场景,分「7大类图」如下目录。

目录
一、关联(Correlation)关系图
1、散点图(Scatter plot)
2、边界气泡图(Bubble plot with Encircling)
3、散点图添加趋势线(Scatter plot with linear regression line of best fit)
4、分面散点图添加趋势线(Each regression line in its own column)
5、抖动图(Jittering with stripplot)
6、计数图(Counts Plot)
7、边缘直方图(Marginal Histogram)
8、边缘箱图(Marginal Boxplot)
9、相关性热图(Correllogram)
10、矩阵图 (Pairwise Plot)

二、偏差 (Deviation)关系图
11、发散型柱形图 (Diverging Bars)
12、发散型文本图(Diverging Texts)-水平方向
13、发散型文本图(Diverging Texts)-垂直方向
14、发散型点图(Diverging Dot Plot)
15、带Marker的发散型棒棒糖图 (Diverging Lollipop Chart with Markers)
16、面积图(Area Chart)

三、排序 (Ranking)关系图
17、排序柱形图(Ordered Bar Chart)
18、棒棒糖图(Lollipop Chart)
19、点图 (Dot Plot)
20、坡图(Slope Chart)
21、哑铃图(Dumbbell Plot)

四、分布(Distribution)关系图
21、连续变量堆积直方图(Stacked Histogram for Continuous Variable)
22、类别变量堆积直方图(Stacked Histogram for Categorical Variable)
23、密度图(Density Plot)
24、带直方图的密度图(Density Curves with Histogram)
25、山峰叠峦图(Joy Plot)
26、分布点图(Distributed Dot Plot)
27、箱图(boxplot)
28、箱图结合点图(Dot + Box Plot)
29、小提琴图(Violin Plot)
30、金字塔图(Population Pyramid)
31、分类图(Categorical Plots)

五、组成(Composition)关系图
32、华夫饼图(Waffle Chart)
33、饼图(Pie Chart)
34、树状图(Treemap)
35、柱状图(Bar Chart)

六、变化(Change)关系图
36、时间序列图(Time Series Plot)
37、波峰和波谷添加注释的时间序列图(Time Series with Peaks and Troughs Annotated)
38、自相关和部分自相关图(Autocorrelation (ACF) and Partial Autocorrelation (PACF) Plot)
39、交叉相关图(Cross Correlation plot)
40、时间序列分解图(Time Series Decomposition Plot)
41、多重时间序列图(Multiple Time Series)
42、双坐标系时间序列图(Plotting with different scales using secondary Y axis)
43、带误差阴影的时间序列图(Time Series with Error Bands)
44、堆积面积图(Stacked Area Chart)
45、非堆积面积图(Area Chart UnStacked)
46、日历热力图(Calendar Heat Map)
47、季节图(Seasonal Plot)

七、分组( Groups)关系图
48、聚类树形图(Dendrogram)
49、聚类图(Cluster Plot)
50、安德鲁斯曲线(Andrews Curve)
51、平行坐标图(Parallel Coordinates)

❤️代码免费献上

python可视化52|最有价值50图表(python实现代码分享)

编辑于 2021-12-26 22:58

01.图表,图形和图表

1.饼图

最受欢迎和批评。“唯一比一张饼图更糟糕的是很多饼图”。现代信息图表之父奥托·尼拉特(Otto Neurath)也拒绝了饼图,而倾向于使用更具语义学的图像学。将饼图分为两个部分时,最好使用饼图:我吃过的饼和剩下的饼。使用两个片段,您仍然可以轻松比较片段的大小-超过两个片段会变得很困难,因此受到批评。一旦拥有三个或三个以上的线段,你就会遇到比较问题–我们的眼睛不习惯于比较圆的线段。


2.维恩图

这是另一个流行且被滥用的图形。一件事做得很好–显示两到三件事重叠。它做得不好的是表明重叠有多大。当您需要显示的只是重叠部分,而没有其他内容,没有数据时,可以更好地使用此图。例子:我们可以用它来形象化解析决心,它由三种品质组成:意志,纪律和野心。


3.同心图

这是切成薄片的洋葱。中间是最重要的事情,或者是目的。重要性应低每一层向外。

4.圆图

这里的原理是比较物体的长度,其中整个圆为100%。这意味着我们无法改变规模。这是显示时间表,比较寿命,完成项目所花费的时间等的好方法。这对于显示时间长度如此不同以至于较小的时间变得不可见的时间段不利。示例:各物质摄入量

5.气泡图

该图表非常适合粗略比较数量。同样,圈子很难精确比较。但是有时不精确对我们有利。最好通过粗略的比较来消化一些信息,特别是如果每个圆的大小更大或更小几个数量级。这对于比较截然不同的预算,恒星和行星,国家人口,食物的营养价值等非常有用。示例:用它来显示媒体文章的喜欢数量。


6.气泡竞赛图

在这里,我们赋予气泡位置以含义。越靠近顶部,一个特定国家的人口受教育程度越高;或恒星更热。那只是使用y轴。使用两个轴:气泡越靠近顶部,越靠近右侧,人口受教育程度越高,寿命越长。示例:世界人口的宏观预测。


7.折线图

该图表是由直线连接的一系列点–线条看起来有多戏剧性,可以显示出某些变化。该图表用途广泛,因为它是如此抽象。但是,关于它的事却很难忘。但是,当您想传达的见解只是某些方面的变化时,它就起作用了。该图表是所有图表中最少的图表,饼图和条形图紧随其后。例如:温度变化,马拉松距离内的心率变化,随时间变化的事故数量等。


8.面积图

通过用颜色填充线条下方的空间来显示两个或多个折线图之间的差异。使用此图表进行趋势比较。


9.散点图

此图表非常适合显示聚类和离群值。在这里,我们要显示值的确切位置。读者不会区分集群内部的点,但是集群外部的点和集群本身将引起注意。


10.环形图或多级饼图

这是具有层次结构的饼图。给定的饼图与中间的距离有多近,就意味着什么。例如,如果中心是时间的开始,则最接近的饼图是自开始以来的第一个时间段。然后,您可以显示该期间内的期间。该图表通常用于显示磁盘空间使用情况,因为计算机中的文件夹和子文件夹之间存在层次关系。示例: 磁盘使用情况


11.扇形图

表示随着距离中心越远,它们的数量就会增加一倍。它用于显示家谱树和思想的演变。



12. Windrose图表

显示有多少东西朝哪个方向发展。该图表起初是一种显示风在各个方向上吹的强度的方法。


13.条形图

显示条形中的数字。与气泡图相比,条形图在显示较少数量的值时效果更好。眼睛可以轻松比较条形的长度–在显示精确值很重要的时候使用它。但是最好不要将其用于比较–而是使用磁带图。


14.胶带图

显示比率–一个数字与另一个数字的关系。想象一下,您有一块胶带可以用来测量所有东西。您的结果将如下所示:这是2根胶带,这是5根胶带,依此类推。为了使图更有意义,可以用简单的图标替换胶带的各个部分。

示例穷人与富人的对比



15.甘特图

显示时间段以及它们之间的关系。该图表最初用于计划项目。用它来显示未来的预测,法庭听证会,火车时刻表等。


16.树形图

使用嵌套的矩形显示层次结构。这样,您可以将矩形划分为更小的矩形(只要确保它们仍然可见)即可。这样,您可以可视化预算,然后在其中查看预算。示例:过早死亡的原因


17.网格

既是安排事物的系统,也是视觉上的类比。作为视觉类比,它可以让您立即知道没有层次结构–每个单元都是相等的。然而,有秩序。示例:上面的图形是一个网格。如果没有更好的类比,许多列表可以组织为网格。


18.元素周期表

这是一个网格,其中单元格在列和/或行中的位置带有某种含义。例如,网格中的单元格越靠右,化学元素的反应性就越高。其他示例包括:越靠右,饮料中的酒精含量就越高,但是越向下,饮料中所含的糖就越多。


19.弧图

此一维图显示了任意两个节点之间的相互作用。它很好地揭示了模式。这里有一些想法:两个国家之间的战争,小说中的人物之间的互动,音乐艺术家之间的合作等。


20. Sankey图表

此处的线条粗细代表数字。可以将Sankey图表想像成是一条从源头流出的河流。当河流开始时,它是一条实线,但随着河流向下,它分裂成主要河流,小河,小河和小溪。


21.和弦图

和弧形图类似,和弦图显示了两个节点之间的交互。所得线的粗细显示了任意两个相互作用的强度。在这样的圆形和弦图中,请确保所有变量的类型相同(同质)。此图表的示例用途是不同总统之间的联系,这些联系通过总统之间的电话呼叫次数,外贸伙伴关系,毒品相互作用,美国主要城市之间的旅行等来衡量。


22.雷达图

每个辐条长度显示一个数字,类似于条形图。但是在这种情况下,我们不强调它们之间的区别。我们对粗略的比较以及有一定数量的辐条这一事实更感兴趣。该图表非常适合分析我们通常认为的整体的组成部分,特征,成分。


23.极坐标网格

显示类似于雷达图的特征,但是在这里您可以添加更多的辐条,因此不受角度数量的限制。提示:您可以使用图表工具在Illustrator中制作此图表。


24.螺旋图

时间序列,其中距当前最近的事件距中心最远。使用此图可显示对未来,演变,时间历史等的预测。


25.时间轴

一个时间序列,其中事件从左上角开始显示,呈螺旋状移动。螺旋线使眼睛自然地跟随叙述,而不必在阅读文本时快速回到下一行的开头。使用时间表可视化传记,故事和说明。


26.并排比较

两条平行线的点表示两件事之间的差异。


27.抽象树

显示层次结构和分组。任何具有子类型的事物都可以表示为树。 如果有更多的读者在移动设备或台式机上观看,则可能更容易从上到下颠倒芦苇。但是对于印刷件,从下到上的方向很好。


28.思维导图

任何东西都可以连接到这里。就像人类的思想一样,无论多么遥远或无关,任何事物都可以连接。用它来集思广益,显示错误的逻辑等。


29.决策树

显示决策之间如何相互流动,节点的形状表明这是哪种决策示例


30.流程图

或方框图–显示解决方案或算法。块方案中的节点根据其形状传达号召性用语。圆角矩形是开始或结束,菱形是决策,平行四边形是输入或输出,而矩形是过程。使用此图表进行决策,战略的可视化,法院判决,辩论等。示例:任何算法都可以表示为一个整体方案。

02.抽象类比

31.金字塔

显示一个层次结构,其中每个上层逐渐小于每个下层。这就是权力和金钱在社会中的分配方式。社会阶层和种姓也是如此。更多抽象的概念也可以使用-基本需求,礼貌程度,营养价值等方面的Maslow金字塔。示例:健康饮食金字塔是一个金字塔,上面有插图,显示了我们对营养的现代理解。尽管您不应该将形状的大小作为推荐的部分阅读,但它确实显示了形状的相对大小和重要性。


32.漏斗

金字塔的反面。例子:在所有潜在候选人经历不同选择阶段时,寻找他们的配偶;客户转化等。示例:转化渠道,销售渠道。


33.辐条轮

所有辐条均支撑中心。但是它们的顺序并不重要。这适用于显示任何事物的平等成员或部分:组织的捐助者,知识的类型,理论,概率等。示例:信息来源信息图中使用了辐条轮。
此外从16世纪,被用来诊断基于颜色,气味和尿液的味道病人。


34.自行车车轮

这种车轮专注于自行车永无止境的性质。当我们想表明我们不确定导致什么的原因时特别有用,这是鸡到蛋还是鸡蛋到鸡。示例:情绪是周期性变化的,如投资者情绪转盘,投资者会周期性地思考。


35.楼梯

这个类比强调达到目标所需要采取的步骤。我们还可以比较楼梯-带有很多小台阶的楼梯可以达到与只有几个但更大台阶的楼梯相同的高度。那是有见地的。人们对楼梯足够熟悉,可以根据楼梯的挑战性来知道上坡有多困难。因此,可以通过使楼梯更陡峭,台阶密集或其他方式来改变楼梯的难度。


36.同型

用物体的数量(图标形状)显示事物的数量,而不是像条形图那样通过增大物体的大小来显示事物的数量。示例:展示死亡人数


7.地铁图

显示具有多个站点的路线如何相交。示例:思维方式如何在您的大脑中相互作用,不同的研究目标如何相互关联,理论如何联系(或不联系),人体如何运输血液,星系在我们银河系中的位置以及它们如何运动相对于彼此。


38.速度表图表

显示从安全到危险,从慢到快等事物的价值增加的方式。


39.齿轮

移动一个齿轮将使所有其他齿轮运动。洞察力是,即使移动一个小齿轮也会使较大的齿轮移动。这个比喻是关于杠杆作用的:为某人提供小小的帮助可能会带来更大的回报,从长期来看,使一个处于不利地位的社区受益的小计划可能会节省很多联邦资金;建造无家可归者收容所可能会减少犯罪等。例如:在这里,我不得不举一个负面的例子: “语言的速度”信息图表背后有出色的研究和信息,但并未使用齿轮来显示机制中的联系,例如他们应该。


40.拼图

尽管看起来不匹配,但不规则的碎片如何组合在一起。示例: 此匿名Internet用户的信息图将他们的气泡图塑造成一个难题,以强调匿名Internet使用是一种协作。

41.杠杆

这表明小事情如何平衡甚至超过大事情。这种类比可以显示出谈判策略,增长潜力,不利者的趋势。示例:在较弱的一面和较强的一面之间保持平衡,其中较弱的一面具有一定优势。


42.比例尺

显示比较,尤其是在需要做出决定时。用它来显示利弊,正面和负面,明智而愚蠢的解决方案等。例如:司法,会计平衡,权力平衡等。


43. Chernoff的脸

人们很容易认出人的脸,因为我们每天都要看人的脸,以了解人们的动机,感受和熟悉程度。脸部的每个变量(眼睛,鼻子,嘴巴)都可以更改以传达信息。这些面孔不仅传达了情感。任何可以轻松编码为人类情感的指标都可以在这里使用。示例:史蒂夫·王(Steve Wang)使用切尔诺夫(Chernoff)的面孔在纽约时报的这张图表中传达了棒球教练的个性。


44.头部轮廓

显示头部内部的各个部分–不同的思想所在以及它们之间的联系方式。示例: 互联网的想法 –我根据读者共享的最受欢迎的媒体文章创建的互联网集体负责人的个人资料。


45.族谱树

这是各种各样的抽象树,有助于追溯血统例如:产品,人员,思想等的继承。


46.解剖

指出对象或人的部分,描述每个部分的工作。使用示例包括企业家解剖,说唱歌手,计算机解剖等。示例: 如何拥有简单的生活 -我的个人计划是基于我自己简化自己的生活。


47.迷宫

这个比喻强调解决方案的路径错综复杂;可能有不止一种出路;以及这些结果是什么。用这种类比来比较策略,政策等。例如:思想,政策,政治等的纠缠。


48.地图

除了对陆地和海洋进行地图绘制之外,地图还可以用于形象地显示互联网世界,例如,陆地是流行的网站,海洋是深层的网络。关键是打个比方-做个传奇。由于地图可能会获取过多的细节,因此对其中的每一个小部分进行类比都很重要。示例:马丁·瓦吉奇(Martin Vargic)绘制 的互联网地图,其中Google,苹果和色情内容为大洲。

03.类比

这些是真实的类比–它们看起来像您熟悉的物理对象。

49.冰山

表明某物的可见部分比水下部分小得多。这是一个描述工作量,成功和抽象过程的标准类比。例如: 虽然不是特别直观,但是 有关SEO策略的此信息图仍然成功地使SEO的抽象更具物理性。


50.山脉

挑战在于获胜意味着登顶。确切的山峰地形为您提供了进行类比的机会–峰顶无法触及,山坡是否一直陡峭,还是随着海拔的升高而变得更容易攀登?示例:我在“ 如何永不放弃”信息图海报中使用了它


51.岛屿

为显示一个孤立的过程,其中清楚地标明了边界,但内部生活却很复杂,一个岛屿可以作为一个类比。例如:亚文化,城市,公司的生活等。

52.三明治

多层的东西散布开来,悬浮在空中,露出了自己的内心。建筑物,车辆,土壤,当然还有三明治或其他任何菜肴,但可能没有人和其他生物。示例:Business Insider出版的《 环游世界:今天的地图集》中的信息图揭示了白宫的内部。


53.宇宙

这个类比描述了围绕一个更大的事物旋转的事物,而没有可见的力将它们吸引–您看不到重力,但是您知道它的存在–您会感觉到。例如,这种类比非常适合人们如何吸引一个想法。还是初创公司吸引什么样的投资者。您可以从这些太阳系中建立一个星系来进行比较。


54.钟面

绝对是大家熟悉的对象,钟表使洞察力显而易见:时间可以分为不同的部分。通过使用不同的颜色密度,我们可以为各部分赋予新的含义-建筑物在某些小时内的繁忙程度,等等。示例:我见过的钟表的最佳用途是根本没有钟,但是因为人们熟悉时钟,很容易知道现在 几点了 –在这种情况下,著名作者起床和入睡的时间在 此图上显示了 来自Brain Picks的作者例程。


55.层次

可以剥离的不同层次的事物进入其心脏。这就是您了解真相或秘密的方式。例如,调查预算的花费,人们使用的借口等。示例: “水预算”信息图描述了影响水成本和质量的层次。


56.过山车

这里的重点是在一秒又一遍地从好到坏的时间。这使人想起经营企业,从事创意工作,处于人际关系,养育子女和情绪普遍的情况。示例:David Hauser 的企业家过山车


57.书架

书籍的大小显示信息量。他们在书架上的订购也传达了信息。例如:Jared Fanning撰写的 “世界十大最读书籍”信息图。


58.根

显示事物如何保持。例如:思想,移民,体内病毒,媒体名人等。示例: “问题根源”信息图显示了二氧化碳增加问题的根源。


59.树

显示分支分裂成越来越小的分支。这个类比描述了知识,思想的传播,物种的演化等。示例: 知识树混淆图表显示了不同类型的知识谬论以及它们之间的关系。



60.循环系统

这显示了从心脏到任何事物外部的运动。使用示例将是交通运输系统-城市的心脏与郊区如何连接。这个比喻的另一个特征是,根据方向的不同,有两种不同的事物在运动-心脏的良性血液和心脏的恶性血液。例如:供应链,交通枢纽–任何具有象征性的心脏并往返于心脏的系统。


04.寓言

这些是故事,或一系列比喻。关键在于这些故事足够熟悉,因此我们不必复述它们,但我们应该将它们的每个部分进行类比。

61.建筑物的生命

建筑物不同房间中的生命活动表明同一个人或事物如何根据其在建筑物中的位置而完全不同地行动。示例:我在信息图表 “ TheResumator的 工作原理”中使用了该图表,它解释了公司如何招聘人才,每个楼层都是流程的一个步骤。 九龙寨城是阿道夫·阿兰兹(Adolfo Arranz)创作的又一永恒作品,使用了我迄今为止见过的最好的比喻。


62.城市生活

城市以将居民组织成公寓,街道和街区的网格而著称,同时允许沿人行道的熵运动。这个类比很好地显示了结构过程是如何工作的,将可预测与随机相结合。示例:我在 图表“启动资金的运作方式”中使用了它,以显示公司发展时如何占用更大的建筑物。另一个例子是我创建的信息图,以帮助解释 Iotera的革命性技术将如何改变城市中人与物之间的交流。


63.马拉松

马拉松是一种时间表。这里的重点是随着比赛的进行,尤其是最后阶段的状态。这个类比适用于容易完成而不是完成的事情:建立公司,撰写小说,例如:我在 “创业马拉松”信息图中使用了它


64.演变

这也是一种时间轴,除了这里我们正在研究事物的逐渐变化。演变的结果与开始时截然不同。随时间推移的计算机版本,对科学的理解等。示例:“ 手机尺寸演变”信息图


65.食物链

在生活的许多领域,都有大鱼,然后有小鱼。大吃小。这个类比适用于公司收购,只有一个获胜者的竞争,预算分配等。例如: “创业生态系统:掠夺者与猎物”信息图


66.专注

当我们想要比较从未发生过的事物时,有意地将它们集中在一处进行比较是很有用的。通过这种方式,我们可以比较彼此相距半个世界的地标,被时间和距离分隔开的著名人物,不邻国的国家。它们之间有一点重叠,使这种效果更加直观。示例: 暂存的世界最高建筑物,集中在虚构的城市中,看起来就像是对未来的预览。要了解过去100年来世界上最高的建筑物是如何变化的,请参见 乔治·克拉姆(George F. Cram)在1880年代所做的可视化。


67.实验

显示事物以不寻常的方式连接的地方,尤其是在将它们组合然后分离然后再次组合的地方。不过,实验是综合性的,与其他自然类比没有那么相关。尽管如此,仍有一项实验用于显示抽象的研究方法-液体的混合及其在管中的运动。示例: “可以学习创业吗?” –在我为世界银行创建的此信息图中,我使用了第2页上的实验类比来显示企业家精神的成分。另一个例子是公司估值的敏捷科学,我将其可视化为 “启动评估的工作原理 ”中的科学实验。


68.工厂

工厂是人为的环境。仅当所有自然条件都不适用时才使用此类比。不是每个人都去过工厂。有些工厂,尤其是那些雇用大量机器人的工厂,对大多数人来说似乎陌生,并且会在类比中变成类比–这无济于事。但是大多数人会意识到工厂内部的机械过程-传送带,小部件,装配线。示例:伦敦设计师张静(Jing Zhang)精通“分解”日常物品,以帮助人们了解隐形物品的工作原理。 这是她想象中的茶壶内部制茶过程的工厂。


69.工具集

描述某人的工作方式可以落入他们的视线–该人在工作或执行某个流程时会看到什么。示例: 正式用餐环境中的此信息图特别注意所有“工具”在表面上的位置。


70.传送带

这是一条自动的设备,可以从一系列相同的对象中添加或减去某些东西。一般而言,学校或教育(从更愤世嫉俗的角度看),诸如新颖的写作,通过法律,质量控制等创造性过程都可以被模拟为传送带。对于我们大多数人认为应该个性化的事物,例如教育和保健,这种类比可能有贬义的含义。示例: 我会在我的启动信息图中 成功


71.道路

有人走过道路。任何可以分解为步骤的内容都可以可视化为道路。烘焙食谱,一种在网站上签名,进行手术,成为宇航员,收拾行李箱等的方式。任何时间轴都可以用作道路。但是,一条道路比时间表更令人激动-因此,首先要问您的信息是否应该富有情感。

示例: 启动马拉松信息图


72.机器

同样是人造物体。只要熟悉其组成部分,任何假想的装置都可以使用。这种类比为您提供了很大的自由-您可以构建任何机器-但同样存在通过类比创建类比的危险。如果要创建一台机器,则应遵循与实际制造一台计算机相同的用户界面原则-应该清楚哪些按钮可以执行操作,过程在何处开始和结束。示例:此 老式信息图表“ Der Mensch als Industriepalast” 解释了人体的内部工作原理。

编辑于 2020-08-14 17:09
阅读本文大约需要 3 分钟
摘 要

不要把生命献给平庸低俗,工作应该是快乐的,如果你不喜欢,就放下,无所谓的。经历了2020-2021年的这些时光,OF越来越希望将自己的时间用在喜欢的事上,比如分享这些可能毫不起眼的数据分析知识,哪怕是有一位读者能够被我们的上进态度所激励,或者能学到一个知识点,OF都会心满意足。

言归正传,经过了01-03这3篇文章的积累,相信大家对Python数据分析也有了一定的认知,今天OF向大家介绍轻松学Python数据分析系列的第4部分:数据可视化图表(1读取数据集->2数据处理->3数据可视化图表)。

  • 主要内容:Excel 办公自动化和数据分析
  • 适用人群:办公室职员 / Python 初学者 / 有志从事数据分析工作的人员
  • 准备内容:Anaconda-Spyder,pandas、seaborn、matplotlib.pyplot库

不会安装库的可以参考如下教程:

一、读取数据集

OF在第03篇文章中已经介绍过了如何下载、读取数据集(文末有01-03篇的链接),就不再赘述。先读取一个目标数据集,以下例子的数据集是在Kaggle下载的(澳大利亚的房产数据),如果需要该数据集也可以私信我。

import pandas as pd
house = pd.read_csv(r'D:\XX\housetest.csv')

拿到这样一个数据集,我们先看看里面有些什么样的数据(把我们要分析的数据列展现出来):

二、数据处理

承接03篇的数据处理方式,我们先观察地下室总面积列的数据。

import pandas as pd
house = pd.read_csv(r'D:\XX\housetest.csv')
print(house["TotalBsmtSF"].isnull().sum())

输出结果:

1

我们可以看到,该列有一个数据是空值,处理缺失值可以分为两类:删除缺失值和缺失值插补。我们以平均数插补为例:

import pandas as pd
house = pd.read_csv(r'D:\XX\housetest.csv')
#将house数据集中"地下室总面积"列数组赋给price_null
price_null = pd.isnull(house["TotalBsmtSF"])    
#将house数据集中"地下室总面积"不为空值的数组赋给good_price
good_price = house[price_null == False]["TotalBsmtSF"]    
#计算good_price的平均值
mean_price = good_price.mean() 
#补充所有缺失值以mean_price这个数值      
house.loc[price_null == True, "TotalBsmtSF"] = mean_price
三、读取可视化图表

经过了数据处理,我们可以开始对数据进行分析了。举个例子,想要统计各种HouseStyle房子的数量,我们可以采用seaborn的barplot。(seaborn教程: seaborn.pydata.org/exam

知识点1:完整的数据分析步骤(1读取数据集->2数据处理->3可视化图表呈现)

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
#1 读取数据集
house = pd.read_csv(r'D:\XX\housetest.csv')

#2 数据处理
#将house数据集中"地下室总面积"列数组赋给price_null
price_null = pd.isnull(house["TotalBsmtSF"])    
#将house数据集中"地下室总面积"不为空值的数组赋给good_price
good_price = house[price_null == False]["TotalBsmtSF"]    
#计算good_price的平均值
mean_price = good_price.mean()       
#补充所有缺失值以mean_price这个数值
house.loc[price_null == True, "TotalBsmtSF"] = mean_price     

#3 可视化图表
df = house.copy()
#统计各种房子样式的数量并按降序排序
house_count = df.groupby('HouseStyle')['TotalBsmtSF'].count().sort_values(ascending=False).reset_index()
sns.barplot(x="HouseStyle", y="TotalBsmtSF", data=house_count)
plt.show()

输出结果:

上述这个例子为大家快速简单地呈现了可视化的效果,接下来OF要通过这个数据集和seaborn库,来呈现一些常用的图表。

知识点2:柱形图countplot/barplot

1)countplot比较简单,计数并画成柱状图。

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
house = pd.read_csv(r'D:\XX\housetest.csv')
   
# 建立matplotlib图表
f, ax1 = plt.subplots(1, 1, figsize=(10, 6), sharex=True)

# 生成柱形图
x1 = house["HouseStyle"]
sns.countplot(x=x1, ax=ax1, palette="Greens_d")

# 展现图表
plt.show()

输出结果:

2)barplot,呈现两列数据的关系,这里有个要注意的,因为x,y轴设置了中文字体显示,所以需要加两行代码,否则x,y轴的标题就不显示了。

plt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签
plt.rcParams['axes.unicode_minus']=False   #这两行需要手动设置

完整代码如下:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
house = pd.read_csv(r'D:\XX\housetest.csv')
#将house数据集中"地下室总面积"列数组赋给price_null
price_null = pd.isnull(house["TotalBsmtSF"])    
#将house数据集中"地下室总面积"不为空值的数组赋给good_price
good_price = house[price_null == False]["TotalBsmtSF"]    
#计算good_price的平均值
mean_price = good_price.mean()       
#补充所有缺失值以mean_price这个数值
house.loc[price_null == True, "TotalBsmtSF"] = mean_price     

# 建立matplotlib图表
f, ax1 = plt.subplots(1, 1, figsize=(12, 7), sharex=True)
plt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签
plt.rcParams['axes.unicode_minus']=False   #这两行需要手动设置

# 生成柱形图
x1 = house["HouseStyle"]
y1 = house["TotalBsmtSF"]
sns.barplot(x=x1, y=y1, ax=ax1, data=house)
ax1.set_title('HouseStyle各户型地下室面积情况', fontsize=20)
ax1.set_xlabel("户型")
ax1.set_ylabel("地下室面积")

# 展现图表
plt.show()

输出结果:

看了上图,大家会看到黑色的一条柱子,这条柱子指的是y轴(地下室总面积)的范围,可能数据呈现的并不直观,那么我们用boxplot更好些。

知识点3:箱形图,它能显示出一组数据的 最大值、最小值、中位数及上下四分位数。

代码,也比较简单,直接将柱形图代码中的sns.barplot,改为sns.boxplot。

输出结果:

如果需要再增加一个区域维度,呈现各区域各户型的地下室面积情况,我们需要使用hue属性。

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
house = pd.read_csv(r'D:\Mechtouch\Pyproject\historypro\datadiagram\housetest.csv')
#将house数据集中"地下室总面积"列数组赋给price_null
price_null = pd.isnull(house["TotalBsmtSF"])    
#将house数据集中"地下室总面积"不为空值的数组赋给good_price
good_price = house[price_null == False]["TotalBsmtSF"]    
#计算good_price的平均值
mean_price = good_price.mean()       
#补充所有缺失值以mean_price这个数值
house.loc[price_null == True, "TotalBsmtSF"] = mean_price     

# 建立matplotlib图表
f, ax1 = plt.subplots(1, 1, figsize=(12, 7), sharex=True)
plt.rcParams['font.sans-serif']=['SimHei'] #显示中文标签
plt.rcParams['axes.unicode_minus']=False   #这两行需要手动设置

# 生成柱形图
x1 = house["HouseStyle"]
y1 = house["TotalBsmtSF"]
hue1 = house["MSZoning"]
sns.boxplot(x=x1, y=y1, ax=ax1, hue=hue1, data=house)
ax1.set_title('HouseStyle各户型地下室面积情况', fontsize=20)
ax1.set_xlabel("户型")
ax1.set_ylabel("地下室面积")

# 展现图表
sns.despine(offset=10, trim=True)

输出结果:

知识点4:直方图和密度图的集合体、线性回归图

如果我们想把几张图一起显示(横向或纵向),在建立matplotlib时,把参数调整成对应数量

#纵向数量改第一个参数,横向数量改第二个参数
f, [ax1, ax2] = plt.subplots(1, 2, figsize=(15, 5))

完整代码如下:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
house = pd.read_csv(r'D:\XX\housetest.csv')
columns = ['LotArea', 'TotalBsmtSF']
df = pd.DataFrame(house, columns=columns)
# 建立matplotlib图表
f, [ax1, ax2] = plt.subplots(1, 2, figsize=(15, 5))
# 建筑面积的分布情况
sns.distplot(df['LotArea'], bins=20, ax=ax1, color='r')
sns.kdeplot(df['LotArea'], shade=True, ax=ax1)
# 各建筑面积和地下室面积的关系
sns.regplot(x='LotArea', y='TotalBsmtSF', data=df, ax=ax2)
plt.show()

输出结果:

结 语

今天,OF简要介绍了制作数据可视化图表的流程和几种图表的作法,在第5篇关于项目实战的文章中我们将实战一些小项目。OF主要为大家介绍最完整、最简单、最实用的方法来学习办公自动化和数据分析,用Pandas对Excel的数据处理已经足够了。预计还有最后一期展现一个完整的项目实战,尽请期待!

1、Pandas的数据结构,即基础原理

2、数据读取和生成

3、Pandas的数据处理

4、数据可视化图表(本篇文章)

5、项目实战

  • 若有读者对选材和内容有任何建议,请随时评论或私信我,只要是好的建议,OF一定不会辜负大家,会有惊喜 送上。
  • 若学员对知识点有疑问或想学习更有用的知识,也请随时评论或私信我,请相信OF的诚意,一定会努力帮助大家发现-解决问题,提高自身的核心竞争力。

发布于 2021-10-08 22:59

数据分析图表类型主要分为7大类

  1. 比较关系图表
  2. 趋势关系图表
  3. 分布关系图表
  4. 排名关系图表
  5. 占比关系图表
  6. 组成关系图表
  7. 空间关系图表

每种类型的数据分析图表,又具体包括数十种图表,本文重点举例最经典、使用频率最高35种



1、比较关系图表

用于展现比较关系的图表,主要使用以下12种

1、饼图

最经典、最常用到的数据分析图表,没有之一!


2、分组柱状图

3、堆叠柱状图

4、折线图

5、条形图

6、水波图

水波图是一种用球形容器和其中的水平线位置来表示进度的示意图,用于数据的比较。


7、散点图

散点图,是将所有的数据以不同颜色的点的形式,展现在平面直角坐标系上的统计图表。


8、环图

通过弧形区块的颜色和弧长,来展现数据的分类和占比情况。


9、关键词云图

展示大量文本数据,通过使用不同的颜色大小来表示不同级别的相对显着性。

简单来说,越突出的,数据就越高。

10、子弹图

直观呈现各指标的完成情况,还能通过各项数据对比,看出哪个项目存在的不足


11、符号饼图

用于比较数据之间的差异大小,相比常用的柱状图和条形图,符号饼图视觉表现力更强


12、玫瑰图

展示数据之间的差异大小,用于比较关系。





2、趋势关系图表

用于展现趋势关系图表,主要包括以下4种:

1、折线图

2、阶梯图

折线根据分类字段分为多根在 x 方向(时间)的信息是完全一致、颜色及 y 方向(变量)信息不一致的折线。

通常用作同一时间区间内多个变量发展趋势的对比


3、瀑布图

瀑布图形似瀑布流水,采用绝对值相对值结合的方式,适用于表达数个特定数值之间的数量变化关系。


4、面积图

使用带填充区域的线段,显示数据在一个具有顺序性的维度上的趋势变化。






3、分布关系图表

用于展现分布关系的图表,主要有以下6种:

1、柱状图

2、直方图

直方图是一种统计报告图,由一系列高度不等的纵向条纹或线段表示数据分布的情况。


3、条形图

4、散点图

5、热力图

热力图,是一种通过对色块着色来显示数据的统计图表。


6、地图





4、排名关系图表

用于展现排名关系的图表,主要使用以下2种:

1、柱状图

基础柱状图
分组柱状图

2、条形图

基础条形图
分组条形图

5、占比关系图表

用于展现占比关系的图表,主要使用以下5种:

1、饼图

2、环图

3、百分比堆叠面积图

4、百分比堆叠柱状图

5、百分比堆叠条形图





6、组成关系图表

用于展现组成关系的图表,主要使用以下5种:

1、饼图

2、环图

3、堆叠面积图

4、堆叠柱状图

5、堆叠条形图

7、空间关系图表

用于展现空间关系的图表,主要使用地图图表:

1、地图

以上。

编辑于 2022-12-27 14:43

01 图表的分类

按图表展示的数据关系分类,大致可分为四类:比较、分布、构成和联系

比较:用于显示数据值与值之间的不同,能够清晰地反映数据的差异。如柱状图、折线、雷达图等。

分布:用于显示定量数据上数值或区间的分布情况。如直方图、正态图、散点图等

构成:用于显示不同分类占总体的比例情况。如饼图、堆积柱形图等

联系:用于显示变量之间的关系情况。如散点图、气泡图、相关矩阵热图等。

按图表展示变量的个数分类,统计图大致可分为:单变量图、双变量图、多变量图等。

按图表使用的数据类型(定量或定类数据)进行分类,可大致将图表分类整理如下图:

X的数据类型Y的数据类型SPSSAU方法可供使用图形
定类-频数、词云、帕累托图饼图、圆环图、条形图、柱形图、词云图、帕累托图等等
定量-描述、PP/QQ图折线图、柱形图、条形图、直方图、PP/QQ图等
定类定类交叉(卡方)柱形图、条形图、堆积柱形图和堆积条形图
定类定量方差、非参数检验折线图、柱形图、条形图、雷达图;箱线图、误差线图、象限图等
定量定类交叉(卡方)柱形图、条形图、堆积柱形图和堆积条形图
定量定量散点图等散点图
2个定类定量簇状图、箱线图、误差线图簇状图(多维折线、多维柱形、多维条形)、箱线图(多维)、误差线图(多维)
--其它统计图Roc曲线、曲面图、梯形图

02 作图思维

画图的时候事实上也有一种思维,基本上作图思路和分析数据的思路是一样的。

首先应该明确:“我有什么数据以及想展示什么信息”,区分出数据类型,然后可根据上面图中总结的图表分类,找出满足要求的图表类型。

不同的目标不同的数据类型,对于图表展示的选择也会有所区别。


如果想要分析不同性别的人,他们在学历之间的差异性,也就是X为定类数据,Y为定类数据,可以选择堆积条形图或堆积柱状图。在SPSSAU中使用【通用方法】--【 交叉(卡方)】来展示。

SPSSAU
堆积条形图

如果想要显示两个定量数据的关系,则可选择散点图。在SPSSAU中可使用【可视化】--【散点图】等来展示。

散点图

03 完善图表信息

确定了图表类型,接下来在SPSSAU操作完成作图即可。在得到图表后,进一步完善图表信息,SPSSAU提供了一些图表样式设置。点击图表下面的[Aa样式]里进行修改。

图表调整完即可点击下载,如果需要下载的图表较多,一个一个下载很麻烦。这时可以点分析结果顶端的【导出所有图形】,一键导出所有图表。

另外如果SPSSAU提供的数据图无法满足你的展示需求,也可以点击图表右上角[↓数据]按钮一键下载所需数据,自行绘制图表。

目前SPSSAU已提供累计30类图形,分布于各个方法中自动生成,点击生成分析结果的同时,系统会自动给出最优的搭配图表

至于一些特殊类型的图表,如帕累托图、ROC曲线等,你可以在【可视化】模块里找到和使用它们。


「更多内容登录SPSSAU官网了解」

发布于 2021-03-29 18:56

数据本身冰冷没有意义的,我们需要通可视化图表将数据直观的表现出来,然后对其进行分析,发现背后蕴藏的规律。数据可视化图表的类型十分丰富,此处不一一列举。主要跟大家分享几种比较简单、常见的数据分析可视化图表以及使用场景。如果简单的图表可以解决问题,为什么还要花里胡哨呢?

常用的可视化图表

常用的可视化图表包括:饼图、柱形图、条形图、折线图、散点图,这五类图表可以满足我们工作中大部分的数据展现与分析需求,简单的图表往往能够有效、形象、快速地传达信息。

这时候你再回想一下,你在日常工作中见到的图表是不是基本上都是以下几种类型。

以上五类图表是最为基本的可视化图表,它们还能够衍生出其他稍微复杂些的图表,比如柱形图还包括簇状柱形图、堆积柱形图、百分比柱形图。

亿信ABI对以上图表进行了比较好的分类与归纳,有兴趣做进一步了解的朋友可以进入 DEMO,在图表分析功能中可以看到。

我曾有过文章介绍常用图表类型,分析其适用场景和局限→ 亿信华辰:社会人必看!玩转数据可视化,这些经典图表有妙用

通过数据间的关系选择图表

用恰当的图表实现数据可视化非常重要,根据归结图表的特点,汇总出几张思维导图,帮助大家更快地选择展现数据特点的图表类型。

比较类

不论是基于时间的纵向比较还是基于分类的横向比较,被统称为比较类数据,发散开来可以有如下展现形式:

构成类

构成又被称作占比,这类图表主要用于展示数据的组成结构,可以用于显示同一维度上数据之间的占比关系。比如各子公司的成本占比、公司利润的来源构成等。


分布类

分布类图表可以较好的表现数据的分布,通常用于展示连续数据上数值的分布情况。例如,在企业进行质量管控过程中为了控制误差,会选择正态分布图。

联系类

联系类图表表现形式与上述分布类有些类似,可以呈现展示多个变量之间的关系。比如,树木随着年龄的增长越来越高,年龄和高度之间是否存在某种联系。

善用数据分析工具

用图表做好数据分析并非易事,它绝非一朝一日之功,但也并不是无规律可循。一图胜千言,亿信ABI数据图表,为不善表达的你,精彩代言!

亿信ABI采用JS、FLASH、HTML5三种技术自主开发统计图,丰富的统计图保证了其具有美观的图形展现能力,除了常用的柱状图、线状图、条形图、面积图、饼图、点图、仪表盘、走势图外,还支持和弦图、圈饼图、金字塔、漏斗图、K线图、关系图、网络图、玫瑰图、帕累托图、数学公式图、预测曲线图、正态分布图、迷你图等,样式包括2D、3D、EXCEL、AUTUMN、FLASH等;通过组合设计可以搭配出上千种视觉效果。

多类地图应用

内置五大洲及世界地图、中国地图,囊括中国34个省239个市区县的地图,地图类型包括FLASH、图片和HTML5格式,同时支持个性化定制地图。

同时也支持GIS地图的应用,使用天地图、ArcGIS、百度地图平台,并可拓展。支持通过点选、框选方式实现地图上数据查询、统计、钻取、预警、渲染、统计图联动、信息提示等。

亿信ABI一站式大数据分析平台-全能型数据可视化分析工具



关于亿信华辰

亿信华辰是中国专业的智能数据产品与服务提供商,一直致力于为政企用户提供从数据采集、存储、治理、分析到智能应用的智能数据全生命周期管理方案,帮助企业实现数据驱动、数据智能,已积累了8000多家用户的服务和客户成功经验,为客户提供数据分析平台、数据治理系统搭建等专业的产品咨询、实施和技术支持服务。

△亿信华辰全产品架构图(点击查看大图)


欢迎关注公众号:亿信华辰Pro
-让数据驱动进步-

编辑于 2021-03-11 13:00

1.柱状图

适用场景:适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较,用于显示一段时间内的数据变化或显示各项之间的比较情况。

优势:柱状图利用柱子的高度,反映数据的差异,肉眼对高度差异很敏感。

劣势:柱状图的局限在于只适用中小规模的数据集。

延伸图表:堆积柱状图、百分比堆积柱状图

不仅可以直观的看出每个系列的值,还能够反映出系列的总和,尤其是当需要看某一单位的综合以及各系列值的比重时,最适合。


2.条形图

适用场景:显示各个项目之间的比较情况,和柱状图类似的作用;

优势:每个条都清晰表示数据,直观;

延伸图表:堆积条形图、百分比堆积条形图



3.折线图

适用场景: 折线图适合二维的大数据集,还适合多个二维数据集的比较。

优势:容易反应出数据变化的趋势。


4.数据地图

适用场景:适用于有空间位置的数据集;

优劣势:特殊状况下使用,涉及行政区域;


行政地图(面积图)

(2)行政地图(气泡图)

(3)地图图表(根据经纬度,可做区域、全国甚至全球地图):点状图

(4)地图图表:热力图

(5)地图图表:(北京某区域)散点图

(6)地图图表:地图+柱状/饼图/条形


5.饼图/环图

适用场景:显示各项的大小与各项总和的比例。适用简单的占比比例图,在不要求数据精细的情况适用。

优势:明确显示数据的比例情况,尤其合适渠道来源等场景。

劣势:肉眼对面积大小不敏感。


6.雷达图

适用场景:雷达图适用于多维数据(四维以上),且每个维度必须可以排序,数据点一般6个左右,太多的话辨别起来有困难。

优势:主要用来了解公司各项数据指标的变动情形及其好坏趋向。

劣势:理解成本较高。


7.漏斗图

适用场景:漏斗图适用于业务流程多的流程分析,显示各流程的转化率

优势:在网站分析中,通常用于转化率比较,它不仅能展示用户从进入网站到实现购买的最终转化率,还可以展示每个步骤的转化率,能够直观地发现和说明问题所在。

劣势:单一漏斗图无法评价网站某个关键流程中各步骤转化率的好坏。

8.词云

适用场景: 显示词频,可以用来做一些用户画像、用户标签的工作。

优势:很酷炫、很直观的图表。劣势:使用场景单一,一般用来做词频。


9.散点图

适用场景:显示若干数据系列中各数值之间的关系,类似XY轴,判断两变量之间是否存在某种关联。散点图适用于三维数据集,但其中只有两维需要比较。

优势:对于处理值的分布和数据点的分簇,散点图都很理想。如果数据集中包含非常多的点,那么散点图便是最佳图表类型。

劣势:在点状图中显示多个序列看上去非常混乱。



10.面积图

适用场景:强调数量随时间而变化的程度,也可用于引起人们对总值趋势的注意。

延伸图表:堆积面积图、百分比堆积面积图,堆积图可以显示部分与整体之间(或者几个数据变量之间)的关系。


11.指标卡

适用场景:显示某个数据结果&同环比数据。

优势:适用场景很多,很直观告诉看图者数据的最终结果,一般是昨天、上周等,还可以看不同时间维度的同环比情况。

劣势:只是单一的数据展示,最多有同环比,但是不能对比其他数据。


12.计量图

适用场景:一般用来显示项目的完成进度。

优势:很直观展示项目的进度情况,类似于进度条。

劣势:表达效果很明确,数据场景比较单一。


13.瀑布图

适用场景:采用绝对值与相对值结合的方式,适用于表达数个特定数值之间的数量变化关系,最终展示一个累计值。

优势:展示两个数据点之间的演变过程,还可以展示数据是如何累计的。

劣势:没有柱状图、条形图的使用场景多。


14.桑基图

适用场景:一种特定类型的流程图,始末端的分支宽度总各相等,一个数据从始至终的流程很清晰,图中延伸的分支的宽度对应数据流量的大小,通常应用于能源、材料成分、金融等数据的可视化分析。


15.旭日图

适用场景:旭日图可以表达清晰的层级和归属关系,以父子层次结构来显示数据构成情况,旭日图能便于细分溯源分析数据,真正了解数据的具体构成。

优势:分层看数据很直观,逐层下钻看数据。


16.双轴图

适用场景:柱状图+折线图的结合,适用情况很多,数据走势、数据同环比对比等情况都能适用。

优势:特别通用,是柱状图+折线图的结合,图表很直观。

劣势:这个好像没什么劣势,个人感觉。

发布于 2021-07-26 14:28

根据图表展示的数据关系,可以将图表分为趋势类、比较类、占比类和分布类四大类。

趋势类

趋势类的图表用于显示数据在一个连续的时间间隔或者时间跨度上的变化

它们的特点是反映事物随时间或有序类别而变化的趋势。

比较类

比较类的图表用于显示数据值与值之间的不同和相似之处

能够比较清晰地反映数据的差异。

占比类

占比类的图表用于表示不同分类的占比情况。将一个区块按照占比划分成多个区块可以很好地帮助用户快速了解数据的占比分配。不适合用于数据量大且分类很多的场景。

分布类

分布类的图表通常用语展示连续数据上数值的分布情况

可以准确稳定地描绘出数据的离散分布情况和聚集区间,同时也利于数据的清晰。

RayData专业版和个人版中都内置了丰富的图表样式

可以帮助用户更好地完成数据分析和数据可视化~

想了解更多数据分析和可视化的知识,可以关注我们哦~

发布于 2020-10-10 18:47

在业务人员进行数据分析的工作中,能最常使用到的数据分析图表类型其实很有限。

所以先列举一些在免费的数据分析工具Yonghong Desktop中大家常用的组件。

(1)表、交叉表和自由表

普通表支持两种展示:细节数据表格,汇总数据表格,对于我们直接展示数据时,很有必要。

(2)柱形图、线图、堆积图

柱形图除了我们普遍使用的柱状图外,在使用功能上还可以拓展出堆积柱状图、多轴柱状图等图表。

(3)线图、堆积线图、面积图、堆积面积图

需要展示连续的数据时,比如时间数据,推荐使用线图。而面积图则更侧重于突出线图下的颜色填充。本质上可以当成一种图表类型。

(4)饼图、环状图、旭日图、南丁格尔玫瑰图

只是做占比类数据,竟然能在使用到这么多图表组件。但是各个组件也有自己的特性,以南丁格尔玫瑰图为例,与饼图不同的是它的标记大小只影响某个扇形区域的半径,不会影响扇形对应的圆心角大小,是一种等角玫瑰图。

(5)地图

地图家族除了普通地图、轨迹图、3D地球等组件外,在地图中,我们还能对它进行各种各样的渲染。比如常用的迁徙渲染,就能以动画的方式在地图上显示数据从起始点到到达点的移动情况。

这里只介绍五类组件,而在Yonghong Desktop的报告制作界面,图表组件、过滤组件、传参组件、自服务分析等组件多达几十种,对于有数据分析需求的小伙伴来说,研究明白这些组件,工作没有解决不明白的问题了。

发布于 2022-07-28 15:37

数据分析图表有很多种,有些是常见的,有些是少见的,可视化图表就是一种视觉上的信息传达的美化,做图表的目的还是为了更好的传达,因为“一图胜千言”嘛

图表的大类划分一般有饼图、线形图、柱状图、混合图、面积图、散点图、极坐标图、关系图、仪表盘、树图、桑葚图、漏斗图、热力图,还有许多特殊的图等等

饼图

折线图

柱状图

柱状图又是一款更加热门的图表类型了,它用途广泛,并且还有不少的变种,创意又实用,可以直观的比较数量的大小

除此之外还有很多创意的柱状图

极坐标图

散点图

想了解更多的图可以上镝数图表看一下,,是一款做可视化图表的工具,很好用,有很多漂亮又简单的模板图,还可以去看看他们做的案例展示,都还蛮不错的

放个链接

发布于 2021-06-25 11:01

可以通过 Microsoft AppSource或 Power BI 获取更多 Power BI 视觉对象。

发布于 2020-07-28 16:12