MaxDiff系列(二) 打分评测和成对比较的优缺点

        

          

在上一篇文章里,我们介绍了瑟斯顿和扎克伯格使用成对比较法解决多个对象偏好测度的问题。那么传统的打分方式的问法到底存在什么问题,而成对比较法是否也有不足之处呢?

        

打分评测方式的主要问题:

        

在上一篇瑟斯顿和Facemash的故事里,我们提到了他们都意识到传统的评分方式在评价多个对象时的不足之处。这种不足体现主要体现在三个方面。

        

先看看通常的打分方式对不同对象评价的例子,通常的问题类似这种样子:

       

打分方式的第一个不足之处在于,我们会受到受访者使用量表习惯的影响。有些受访者总是倾向于打高分(或打低分)。再如有些人会有意识地使用1-5分中的各种分值,而有些受访者则仅仅使用少数几种分值。尽管这看起来的确揭示了受访者的某些个性,但这种尺度使用上的“个性”对分析人员而言可不是福音。如果是一个涉及到多个地区/国家的研究,我们往往还会发现不同地区或国家的受访者在使用打分尺度上存在着很大的差异。

        

      

其次,受访者还会以不同的方式理解量表的含义。有些受访者会将这种量表理解为一种等比的形式,譬如4分的重要性是2分的两倍,有些受访者可能会将这种量表理解为有序的形式,即4分优于2分,但并不认为4分是2分的两倍。这使得这种打分评价答案的数据特性并不适合进行一些统计分析,例如方差分析,回归,聚类,因子分析等。对于受教育程度较低的人群或儿童来说,他们很难理解这种量表的意义。下面这个小漫画很形象的描绘了尺度使用的差异性。

        

精彩全文请点击:MaxDiff系列(二) 打分评测和成对比较的优缺点