淘宝信息无障碍设计标准

2016年05月17日 438阅读

发表于 2013 年 4 月 18 日 由 一丝

编写部门:淘宝无障碍小组

前 言

本标准是淘宝信息无障碍系列标准之一,该系列标准针对不同人群的需要分为四个系列:

¨ 服务于身体机能差异人群的信息无障碍系列标准

¨ 服务于基础环境差异人群的信息无障碍系列标准

¨ 服务于文化环境差异人群的信息无障碍系列标准

¨ 服务于行为习惯差异人群的信息无障碍系列标准

其中身体机能差异人群的信息无障碍系列标准目前包括如下两个标准:

1、 淘宝信息无障碍-网站设计无障碍要求

2、 淘宝信息无障碍-网站开发编码标准

本标准在制定过程中参考了万维网联盟(W3C)制定的WCAG 2.0 规范。

本标准由淘宝(中国)软件有限公司无障碍小组提出并整理。

本标准起草单位: 淘宝(中国)软件有限公司无障碍小组

本标准主要起草人: 米娅 布可 岑坚 平卉

淘宝信息无障碍设计标准

1 范围

本标准规定了无障碍上网的网页设计技术要求,其中包括网页内容的可感知要求、接口组件的可操作要求、内容和控制的可理解要求、内容对现有和未来可能出现的技术的支持能力要求等。

本标准适用于淘宝网的拥有者、网站管理人员、网页开发者设计、开发和管理淘宝网站,同时适用于身心障碍人士、有特殊需求的健全人使用。

2 概述

信息无障碍是要保证人们信息的输入和输出无障碍。人们通过看和听输入信息,通过说话、写字和敲击键盘输出信息,在某一种输入输出功能无法正常执行的情况下,要使用替代的方式或辅助工具来帮助人们完成信息的输入输出,实现无障碍通信。

人们在获取信息方面的障碍主要体现在视觉、听觉、运动和认知障碍上,健全人由于某些原因也可能无法正常访问网页,具体类型如下:

l ¨可能无法看见、听见、移动,不方便或完全无法处理某些类型的信息;

l ¨可能在阅读理解文本方面有困难;

l ¨可能无法使用键盘或鼠标;

l ¨使用的可能是只能显示文本的显示器、小显示器或者低速的 Internet 网络连接;

l ¨可能不会流畅地说或理解文档书写所使用的语言;

l ¨眼睛、耳朵或手在忙于做其他事情(例如驾车、在噪音环境下工作等);

l ¨可能使用了早期版本的浏览器、完全不同的浏览器、语音浏览器或不同的操作系统。

信息无障碍服务的目的是要帮助任何人在任何条件下获取网络信息,要保证网页可以被任何人直接或借助辅助工具访问到,要求网页设计做到以下几点:

l ¨网页内容必须是可感知的;

l ¨网页内容中的界面组件必须是可操作的;

l ¨网页内容和控件必须是可理解的;

l ¨网页内容必须足够健壮,能够与当前及未来的用户代理(包括辅助技术)协同工作。

这四项原则为任何人访问和使用 Web 内容奠定了必要的基础。并为提高残障人群感知、操作和理解 Web 内容的能力提供支持。每项原则之下都有许多特定的规范来实现该原则。而在每一项特定的规范之下又有若干合格标准来评估是否符合该特定规范。

每项原则之下的规范的合格标准被划分为三个等级:

l ¨ 第 1 级合格标准

- 实现最低级别的无障碍访问。

- 可以合理地应用到所有 Web 内容中。

l ¨ 第 2 级合格标准

- 实现强化级别的无障碍访问.

- 可以合理地应用到所有 Web 内容中。

l ¨ 第 3 级合格标准

- 实现附加的增强的无障碍访问。

- 并非必须应用到所有 Web 内容中。

本标准针对建设信息无障碍网站所需要解决的问题做出规定,并不针对具体使用的技术,即不针对 HTML、XML 或任何其他特定技术。这种方式有利于把标准的规定应用于多种场合和技术中,包括那些目前尚不存在的场合和技术。

以下各章规定了无障碍网页开发设计要求,以便使残疾人、特殊环境条件下的健全人都能够直接或借助辅助工具获得网页信息。

3 定义和缩略语 

信息无障碍 

是指无论健全人还是残疾人、无论年轻人还是老年人都能够从信息技术中获益,任何人在任何情况下都能平等地、方便地、无障碍地获取信息、利用信息。 

网页无障碍 

指残疾人、有特殊需求的健全人可以获取网络上的任何信息,为了做到这一点,就要实现网页内容无障碍以及上网使用的辅助软件技术的无障碍。

辅助技术

是指作为用户代理的硬件和/或软件。为了满足存在身体机能差异性的特殊人群(例如残疾人)的需要,在主流用户代理提供的功能之外,它们提供了一些特殊的功能,也可以与主流用户代理一起提供特殊的功能。

辅助技术提供的特殊功能包括替代性表现形式(例如合成语音或放大的内容)、替代性输入方式(例如语音输入)、附加的浏览和导航机制、内容转换(例如使表格更易于访问)等。辅助技术通常是通过使用和监规 API 来与主流用户代理交换数据和消息。主流用户代理和辅助技术之间没有绝对的区别,很多主流用户代理提供了一些支持残疾人使用的特殊功能。基本的区别是主流用户代理的服务目标是更为广泛的不同类型的人群,通常包括健全人和残疾人。 

本标准涉及的比较重要的辅助技术包括: 

l 屏幕放大器,由存在视力障碍的人员使用,可以放大屏幕上的字体并改变颜色,以改善改变后的文本和图像的视觉可读性; 

l 屏幕阅读器,由盲人或存在阅读障碍的人使用,以便通过同步语音或盲文显示来读取文字信息; 

l 语音识别软件,可以由存在某些生理障碍的人使用; 

l 替代性键盘,由存在某些生理障碍的人使用,以便模拟键盘的功能; 

l 替代性指点设备,由存在某些生理障碍的人使用,以模拟鼠标定位和按钮动作。 

用户代理 

能够检索并向用户展现 Web 内容的软件。例如:Web 浏览器、媒体播放器、控件以及其他程序(包括辅助技术),它们能够帮助检索及展现 Web 内容。 

多媒体 

与另一种媒体和/或基于时间的交互式组件相同步的音频或视频。 

自然语言 

人类之间交流所使用的语言,包括口头语言、书面语言以及手语。

字幕 

与多媒体一起显示并与之同步的文本,不仅提供讲话内容,还提供声音效果,有时还提供说话者的身份。 

文本 

字符序列,字符是指 Unicode/ISO/IEC 106464 库中的字符。 

替代文本 

用于替代非文本内容的文本,例如对图片提供一段文字解释,主要作用是方便视觉障碍者借助辅助工具了解非文本内容,例如使用读屏软件读懂图片内容。 

非文本内容 

在用户代理按照内容类型的正式规范显示时,无法用单个Unicode 字符或 Unicode字符序列显示的内容。 

注:这包括 ASCII 图形,它是字符构成的图案。 

音频描述 

附加于音轨上的叙述,以描述仅从主音轨上无法理解的重要视觉细节信息。 

l 对视频的音频描述能够提供动作、角色、场景更替以及字幕文本等方面的信息。 

l 在标准音频描述中,叙述添加于当前对白的停顿期间。 

扩展音频描述 

添加于视听表现形式上的音频描述,在添加时,需要暂停视频,以便有时间添加额外的描述。只有在不增加音频描述就无法理解视频信息的情况下才使用此技术。 

由色彩展现的信息 

完全依赖感知色彩的能力展现的信息。 

视频 

使图片或图像活动的技术。视频可以由动画或者图片或者两者共同构成。 

闪烁 

每秒亮起、熄灭 0.5 至 3 次。 

一般闪烁门限 

同时满足以下三个条件的一系列闪烁或者快速变化的图像序列: 

l 在以 1024 x 768 像素的分辨率观看内容时,同时(但并不一定相邻)的闪烁区域合计占据了显示的屏幕区域上任何 341 x 256 像素矩形的四分之一以上; 

l 在任何一秒钟的时间内,有三次以上的闪烁; 

l 闪烁频率低于 50 Hz。 

红色闪烁门限 

从深红色中退出或者转变为深红色,而丏同时满足下述全部三个条件: 

l 在以 1024 x 768 像素的分辨率观看内容时,同时闪烁的区域合计占据了显示的屏幕区域上任何 341 x 256 像素矩形的四分之一以上。 

l 在任何一秒钟的时间内,有三次以上的闪烁。 

l 闪烁频率低于 50 Hz。 

亮度对比度 

(L1 + 0.05) / (L2 + 0.05),其中 L1 是较亮的文本或背景颜色的亮度,L2 是较暗的文本或背景颜色的亮度。 

上下文变化 

是指以下方面的变化: 

l 用户代理; 

l 观察窗 (viewport); 

l 焦点 (focus); 

l 改变 Web 单元含意的内容。内容的变化并不总是上下文的变化。内容上的微小变化,例如展开的轮廓或者动态菜单,并不改变上下文。 

上下文相关的帮助 

帮劣文字,它们提供与当前操作功能相关的信息。 

事件句柄 

对用户(或用户代理)所采取的动作做出响应的一段代码。 

在网页上,事件一般是指用户动作,例如移动鼠标、打字等等。 

l 事件句柄决定了对动作做出的响应。 

l 不特定设备相关的事件句柄只会对一种输入设备的动作做出响应。 

l 抽象事件句柄是可以由多种输入设备激活的句柄。 

聚焦 

电脑操作系统或应用程序需要获得鼠标、键盘或者其他类型的输入设备(比如手写笔)在屏幕(或窗口)上输入信息的位置,这个位置被称作输入焦点,操作系统或应用程序获得输入焦点的行为被称作聚焦。通常鼠标的单击会使系统自动获得焦点,光标的移动也会使系统自动获得焦点。 

激活 

鼠标、键盘或者其他类型的输入设备的某种动作(例如点击鼠标、按下按钮等)会引发电脑操作系统或应用程序完成某种操作(例如弹出窗口等),输入设备完成的这种动作叫做激活。 

键盘接口 

软件使用的接口,用于获得按键输入。 

与时间相关的输入 

输入的结果不输入装置移动的速度相关,例如线条粗细的变化不用笔的速度和压力有关,这种输入方式必须使用眼睛来配合,不适合视障人士使用。 

标签 

文本、图像或声音,提供给用户以识别 Web 内容中的组件。 

角色 

软件用以识别 Web 内容中组件功能的文字或数字。例如标明某图像用作超级链接、命令按钮或复选框的数字。 

结构 

各创作单元相互之间的组织方式以及一系列 Web 单元的组织方式。 

表现 

将内容和结构呈现为一种用户能够感知的方式。 

Web 单元 

信息的集合,由一种或多种共同展现的资源构成,并由单个统一资源标识符(例如 URL)进行标识。例如包含所有内嵌图像和媒体的 Web 页面。

4 内容的可感知性

4.1 为所有非文本内容提供替代文本

目的是确保所有非文本内容可用文本形式展现。在这里,“文本形式”指的是电子文本,而不是文本的图像。电子文本有一个独特的优势,那就是它可以从视觉、听觉、触觉上或者它们中的任何组合方式上被感知。从而,以电子文本表示的信息可以以用户最容易接受的方式传达给用户。此外,它还可以很方便地被放大和朗读,或者以任何触觉方式呈现,从而使得内容可以更容易地被理解和传播。

4.1.1 等级1 要求

4.1.1.1 非文本内容如果向用户呈现了一些信息,或者对用户的输入给予响应,则应提供替代的文本信息。替代的文本信息应具有相同的效果,并呈现同样的信息。如果替代的文本信息不能支持同样的效果,则至少应指明非文本内容的用途。

4.1.1.2 如果提供非文本内容的目的是为了确认该内容被一个人操作过了,而不是被电脑操作过,那么应提供适合多种残障人士使用的不同的操作形式。

例如:验证码,需要提供图文、语音验证码。

4.1.2 等级2 要求

4.1.2.1 非文本内容如果是多媒体、动态视频、动态音频内容,测验或练习,必须要使用特定的感知器官,不能转化为等效的文本描述,则至少应提供一段替代文字,解释一下非文本内容的用途。

4.1.2.2 非文本内容如果纯粹用于装饰,或者用于描述图像格式,不呈现给用户,那么应通过辅助技术把这些内容过滤掉。

a) 情况A:如果一段简短的描述能够起到与非文本内容相同的作用,提供同样的信息,那么提供一段简短的替代文本就可以了。

b) 情况B:如果一段简短的描述不能起到与非文本内容相同的作用,不能提供同样的信息(例如图片、图表),那么除了提供一段简短的替代文本对非文本内容进行简要描述之外,还要采用下列方式之一提供篇幅较长的描述:

l ¨ 为非文本内容提供一段长描述,这段描述要与非文本内容起到相同的作用,提供同样的信息。

l ¨ 在非文本内容的附近提供一段长描述,同时在简短描述中提供指向信息来指明长描述的位置。

l ¨ 在其他位置提供一段长描述,同时在紧邻非文本内容的地方设置一个指向长描述的链接。

c) 情况C:如果替代文本不能起到与非文本内容相同的作用,则要提供一段指明非文本内容的用途的文字描述。

d) 情况D:非文本内容如果是必须使用特定感观的多媒体、单纯的实时音频、单纯的实时视频、测试或测验内容,或者用于产生特定的效果,则应:

l ¨ 提供一个对单纯的实时音频、单纯的实时视频的用途进行描述的标签;

l ¨ 提供一个非文本内容的可接受的名字,或者描述性的名字。

e) 情况E:非文本内容如果是应该被辅助技术过滤掉的,则应对非文本内容进行处理或标注,便于将它过滤掉。

4.1.3 等级3要求

对于涉及验证的非文本内容(例如验证码),提供替代的音频表现形式。

4.1.4 等级4 要求

无等级 4 要求。

4.1.5 等级5 要求

无等级 5 要求。

4.2 为多媒体信息提供同步替代文本

本规定的目的是帮助获取信息有障碍的人了解多媒体的信息内容。

在很多对话中,音频描述不能恰当地插入到对话中存在的停顿当中。为多媒体内容提供同步替代内容的第1 级合格标准中规定的方法允许用户访问多媒体中全部的信息。这种方法还允许用户在音频描述由于某些原因不可用的条件下以非可视化方式访问可视化信息。

对于包含交互功能的多媒体信息,交互元素(比如连接)应该可以被嵌入到全部多媒体信息的文本替代内容中。

本节(在第 3 级合格标准中)也包含多媒体内容的手语翻译以及扩展音频描述的方法。在扩展音频描述中,视频播放可以被定时冻结,以便更多的音频描述内容可以被插入到对话之间的停顿中。

4.2.1 等级1 要求

4.2.1.1 对预先录制的多媒体信息要提供字幕;

l ¨ 提供一个直接嵌入视频流的开放标题;

l ¨ 提供一个封闭标题

4.2.2 等级2 要求

4.2.2.1 对于预先录制的多媒体信息,对包括任何互动信息在内的内容,要提供视频内容的语音描述信息,或提供全部多媒体内容的文本替代描述信息。

l ¨ 提供一个包含音频描述的声轨,做为主要声轨;

l ¨ 提供一个包含音频描述的声轨,并将其与多媒体内容联系起来;

l ¨ 提供具有自己的声轨的音频描述,并实时地将描述轨与多媒体内容的原始声轨合并;

l ¨ 提供一个包括各种交互功能的完全的多媒体替代文本。

4.2.3 等级3 要求

4.2.3.1 对预先录制的多媒体信息,提供了视频信息的音频描述;

l ¨ 提供一个包含音频描述的声轨,做为主要声轨;

l ¨ 提供一个包含音频描述的声轨,并将其与多媒体内容联系起来;

l ¨ 提供具有自己的声轨的音频描述,并实时地将描述轨与多媒体内容的原始声轨合

l 并。

4.2.3.2 对实时动态多媒体信息提供字幕。

l ¨ 为动态多媒体内容产生标题,并且提供之间嵌入视频流的开放标题;

l ¨ 为动态多媒体内容产生标题,并且提供封闭标题。

4.2.4 等级4 要求

4.2.4.1 对多媒体信息提供手语解释;

l ¨ 在视频流的一角提供手语翻译;

l ¨ 提供有手语翻译的同步视频内容,可以通过不同的观看途径来播放,或者重叠在图像上播放。

4.2.5 等级5 要求

4.2.5.1 对于预先录制的多媒体信息,提供视频信息的扩展的音频描述信息。

l ¨ 为多媒体内容产生一个扩展的音频描述,这种描述可以是文本之外的其他形式(例如在白板上写字画图等等)。

4.2.5.2 对于预先录制的多媒体信息,提供包括所有互动信息在内的所有多媒体信息的替代

文本。

l ¨ 在紧邻非文本内容的地方设置一个指向替代文本的链接;

l ¨ 链接到包含所有交互功能的完全的多媒体替代文本。

4.3 保证信息和结构可以与表现相分离

本规定的目的是确保全部信息能以一种所有用户都能感知的方式来传递。如果所有的信息能够以一种可以由软件决定的格式来传递,那么它就可以以不同的方式(可视的、可听的、可接触的)呈现给用户。如果信息被内嵌到一种特定的方式而使得信息不能和显示分离,那么信息就不能按照用户的需要改变成其他格式。

本规定中的合格标准都是为了确保那些通常和显示方式紧密结合在一起的信息能够以不同形式存在,以便于它们可以以其他形式被显示。

4.3.1 等级1 要求

4.3.1.1 用“表现”来传递的信息和“关系”可以用软件识别,“表现”发生变化时,用户代理以及辅助技术能够得到通知;

l ¨ 通过表现来传递的信息和关系要可以被程序识别;

l ¨ 使用语义元素来标识结构。

4.3.1.2 对于用颜色传递的信息,在没有色彩时同样清晰可辨;

a) 情况A:如果某个字的颜色是用来传递信息的,那么:

l ¨ 要保证用颜色传达的信息同样可以在文本中获得;

l ¨ 只要使用颜色提示,就相应地提供一个文本提示。

b) 情况B:如果图像中用颜色来传达信息,那么:

l ¨ 使用颜色和图案(例如,矩形图和饼图上的色块要用线条或纹理来填充);

l ¨ 保证颜色所传达的信息同样可以从文本中获得。

4.3.2 等级2 要求

4.3.2.1 当内容的顺序影响它的含义时,顺序可以被软件识别和确定。

l ¨ 在 Web 单元中对所有内容以一种有意义的顺序进行排列;

l ¨ 以一种有意义的方式对内容标注顺序,并且按照这种顺序来排列内容。

4.3.3 等级3 要求

4.3.3.1 文本的表现形式变化所传达的信息,也要在传送文本时表达出来,或者要让软件程序能够确定文本表现形式的变化。

l ¨ 标注需要强调的或者特殊的文本;

l ¨ 文字的表现形式变化所传达的信息也要能够通过文本来传达。

4.3.3.2 理解并操作内容所需要的信息与组件的形状、大小、视觉位置或方向无关。