用户体验度量

产品或服务设计后，就需要对其体验进行度量，这里将介绍常见的度量方法。

总结性评价与形成性评价

以学生作文为例，总结性评估就是老师直接将论文给分为优良中差，并不给学生具体的分值。形成性评价，就需要给出具体的得分和扣分原因，解释为什么学生得分为良或不及格。

软件形成的总结性评估

使用量表对软件产品进行度量是常见的总结性评估方法。

常见量表：

SUS
SUMI

SUS的应用示例

Gitlab的用研团队使用SUS来追踪用户感知到的系统可用性。

2022财年第一季度SUS分值

68.1 (-2.7 difference from Q4FY21)

- 455 complete responses
- Margin of error: +/- 1.3
- Grade: C / Adjective: "OK"

有了该总分（68.1分），用研团队或管理者就可以对公司的系统有一个宏观了解，或者基于此设置部门的KPI，例如Gitlab Q1FY22比 Q4FY21 还降低了，该指标的降低，必然会引起重视要进一步分析原因。

Summative Evaluation可以从宏观层面给出一个趋势性的说明，对于细节的成因是不了解的。

形成性评估

和总结性评估相比，形成性评估则可以展示更多的细节，让用研人员能清楚的了解可用性高或低的原因。

形成性评估关键步骤：

确定典型用户
确定典型任务
请典型用户完成典型任务
观察和记录实验过程
分析实验数据（任务完成率，完成时间、出错数、出错类型）

量表

量表与问卷的区别

量表是度量工具，可以等同于体重计或温度计。就像体重计可以量出一个人的体重，抑郁量表可以量出来一个人是否抑郁。

量表作为一个度量工具，是需要有一定的信度和效度的。就以最近的体温枪为例，这种测温方式，使用了红外线进行非接触式测温，在出厂前一定要做校验的。一个是信度，有的体温枪，每次测温度都不一样，第一次测31，第二次33，第三次有35了。类似于量表，同一个人用同一个量表，有的时候量出来也不一样，就是内部一致性不够。

还有就是效度了，就是体温枪能不能量出体温，这个时候也需要跟传统水银温度计做一个校准的，看结果是否一致。

一个量表，尤其是标准量表一定是需要精密测试，然后才能作为检测工具的，所以我们在做用户体验度量的时候，可以尽可能选用标准量表。

量表的常见研制过程

以SUMI为例，研究者需要确定度量目标……（待补充）

常见量表

指标	量表	说明
系统可用性	SUMI
满意度	QUIS
体验	UEQ
Online Trust
正向情绪/负向情绪	PANAS	更多介绍
用户体验	supr-q

Tools

常见统计值计算器