【1.3.4】统计图:直方图、条形图、饼图等

一、统计图的结构

统计图是统计资料的一种表达方式,它可以简洁直观地表示统计表中枯燥的数据,可 以帮助我们从众多的数据中发现规律,可以更迅速、更有效地传递信息,给人以明确而深刻 的印象。

我们看图 3.15,这是一张统计图,是反映中国三次产业增加值的发展状态的趋势图。

观察图形我们可以看出统计图基本包括以下几部分:

  1. 标题,统计图一般包括图表标题、数值轴标题
  2. 坐标轴和网格线,坐标轴和网格线构造了绘图区的骨架,借助坐标轴和网格线, 我们可以更容易读懂统计图。
  3. 图表区和绘图区,统计图的所有内容都在图表区内,包括绘图区。统计图绘制在 绘图区内。
  4. 图例,图例用来标明图表中的数据系列。图 3.15 有三个序列,我们用不同颜色 的线条来区别不同的数据系列,在图例中对其进行说明。

二、统计图的种类

统计图的种类很多,常用的有用于辅助统计分析的直方图、趋势图、散点图;有擅长 直观表现数据的柱形图、饼图、圆环图等。Excel 提供了 14 种标准图表类型,见图 3.16,每 种标准图表类型还可以包含几种不同的子类型,我们可以根据需求决定采用哪种图形来表现 数据。

2.1 饼图

饼图(pie chart)是用圆形和圆内扇形的面积来表示数据值大小的图形。每个圆形面积 代表 100%,圆内扇形面积表示各组成部分的数据占全部数据的比例。

2.2 条形图

条形图(bar chart)是用宽度相同的条子的高低或长短表示数据变动特征的图形。条形 图可以横置也可以竖置,有单式、复式和分段式等多种形式。

2.3 直方图、折线图与曲线图

(1)直方图(histogram)

是在平面坐标上,以横轴根据各组组距的宽度标明各组组距,以 纵轴根据次数的高度标示各组次数绘制成的统计图。纵轴的左侧标明次数,右侧标明频率, 如果没有频率,直方图只在左侧标明次数。

(2)折线图(polygon)

是在直方图的基础上,用折线连接各个直方形顶边中点,并在直方 图形两侧各延伸一组,使折线与横轴相连。也可根据各组组中值与次数求出各组的坐标点, 并用折线连接各点而成。折线所覆盖的面积等于直方图条形的面积,表示总次数。

(3)曲线图

是连续型随机变量频数分布常用的形式。曲线图绘制的方法出在折线图的基础 上,将连接各组次数坐标点的折线加工修匀为比较平滑的曲线。

2.4 茎叶图与箱线图

(1)茎叶图(Stem-and-Leaf Plot)

,它的思路是将数组中的数按位数进行比较,将数的大小 基本不变或变化不大的位作为一个主干(茎),将变化大的位的数作为分枝(叶),列在主干 的后面,这样就可以清楚地看到每个主干后面的几个数,每个数具体是多少,它比直方图保 留了更多原始资料的信息。

(2)箱图(Boxplot)

它由三部分组成,第一部分是矩形框,箱图的主体,下中上三条线 分别表示变量值的第一、第二和第三四分位数,变量的 50%的观测值落在这一区域中;第二 部分是触须线,中间的纵向直线,除奇异值和极值以外的变量值称为本体值,上端横线是本 体值的最大值;下端横线是本体值的最小值;第三部分是奇异值和极值,奇异值,使用“o” 标记,超出 1.5 倍四分位差;极值,使用“*”标记,超出 3 倍四分位差。

参考资料

  • 《统计学》 南京财经大学 陈耀辉、王芳、王庚、韩中、张艳芳、黄莉芳
药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn