基于计量尺度的数据分类

在统计学中,可根据统计数据的计量尺度不同进行分类,具体地可划分为四类:Nominal Data 定类数据、Ordinal Data 定序数据、Interval Data 定距数据、Ratio Data 定比数据。这四种数据类型层次是由低到高的,高层次类型的数据可以应用低层次类型的数据的分析方法,反之则不行。这里来对这四种类型数据做详细的解释说明

abstract.jpeg

Nominal Data 定类数据

Nominal Data 定类数据,又称作称名数据。例如我们对A(男)、B(女)、C(男)三人的性别进行统计,在调查表的性别项作如下规定,男性填10,女性填40。则得到这三人性别的统计数据依次为:10、40、10。很明显这里的10、40数据实际上只是指代某个类别,不具有任何顺序、大小的关系。如果我们愿意,完全可以用2表示男性、3表示女性。所以对于定类数据而言,仅支持 =、≠ 运算,来判断两个数据是否属于同一个类别;其不支持>、<、+、-、×、÷运算。例如这里的例子中,如果我们将10、40相加得到50,其结果无任何实际意义。常见的定类数据有:性别、真实性、国籍、民族等

Ordinal Data 定序数据

Ordinal Data 定序数据,又称作顺序数据。例如我们对A(1.8m)、B(0.8m)、C(1.3m)三人的身高进行统计,在调查表的身高项作如下规定:[0,1m) 填1,[1m,1.5m) 填2,[1.5,2m) 填3。则我们可得到这三人身高的统计数据依次为:3、1、2。这里的数据3、1不仅反应了两个数据是否属于一个类别,同时还反应了二者之间的顺序关系,即3>1说明A比B高。所以对于定序数据而言,其支持 >、< 运算,来判定两个数据的顺序关系。同时如我们上文所言,高层次类型的数据可以应用低层次类型数据的分析方法。故对于定序数据而言,其亦支持 =、≠ 运算。常见的定序数据有:教育程度、服务评级、比赛名次

Interval Data 定距数据

Interval Data 定距数据,又称作等距数据。例如我们对A(33℃)、B(30℃)、C(37℃)三人的体温(Unit: ℃)进行统计,可得到这三人的体温依次为:33℃、30℃、37℃。我们将A和B的体温相减 33-30 = 3,则可知A比B的体温高3℃。所以对于定距数据而言,其支持 +、- 运算,但是不可以进行 ×、÷ 运算。比如在本例中,我们将A、B的体温相除 33/30=1.1,我们不能说A的体温比B体温热1.1倍。因为摄氏温度中的0℃不表示绝对的零点,即没有温度。其只是一个人为定义的标准。所以对于定序数据而言,由于不存在绝对的零点,故对其进行 ×、÷ 运算是没有任何意义的。在定序数据中,0值是作为比较的标准,而不是表示没有。当然,其同样亦支持 =、≠、>、< 运算。常见的定距数据有:摄氏温度、华氏温度、年份、纬度、经度、考试成绩等

Ratio Data 定比数据

Ratio Data 定比数据,又称作比率数据。例如我们对A(50kg)、B(25kg)、C(10kg)三人的体重(Unit: kg)进行统计,可得到这三人的体重依次为:50kg、25kg、10kg。我们将A、B的体重相除 50/25=2,这时我们就可以说A比B重2倍。原因在于体重数据是存在绝对的零点,显然体重为0kg时表示的是没有体重。所以对于定比数据而言,其之所以支持 ×、÷ 运算,是因为存在绝对的零点,即0值表示没有。当然,其同样亦支持 =、≠、>、<、+、- 运算。常见的定比数据有:体重、身高、绝对温度、体积等

参考文献

  1. 现代心理与教育统计学 张厚粲、徐建平 著
  2. 统计之美 李舰、海恩 著
0%