音声コンテンツにはトランスクリプトを付ける

Web コンテンツで音声を用いる場合 (ポッドキャストなど)、アクセシビリティ上の配慮として「代替コンテンツ」を用意することが求められます。

JIS X8341-3:2010 の規定を見ると、以下のように書かれています。

収録済みの音声しか含まないメディアは、次の事項を満たさなければならない。ただし、その音声がテキストの代替メディアであって、代替メディアであることが明確にラベル付けされている場合は除く。

a) 収録済みの音声しか含まない場合
時間の経過に伴って変化するメディアに対する代替コンテンツによって、収録済みの音声しか含まないコンテンツと等価な情報を提供している。

出典 : JIS-X8341-3:2010「7.1.2.1 収録済みの音声しか含まないメディア及び収録済みの映像しか含まないメディアに関する達成基準 (等級A)」 (一部抜粋)

筆者註 : 上記で言う「音声しか含まないメディア」とは、映像 (視覚によって伝わる情報) との同期を伴わない、音声のみで構成されるコンテンツのことを指します。

ここで言う「代替コンテンツ」は、主に聴覚障害者に対する、視覚による情報保障になります。W3C が勧告する Web コンテンツのアクセシビリティ指針「WCAG 2.0」の関連文書「Techniques for WCAG 2.0 (実装方法集)」を読むと、「G158: 時間の経過に伴って変化するメディアの音声しか含まないコンテンツに対して代替コンテンツを提供する」というセクションがありますが、それによるとこの「代替コンテンツ」は、実質的には「トランスクリプト」と呼ばれる、音声情報の内容をテキストに書き起こしたコンテンツになります。

トランスクリプトの提供方法

トランスクリプト (テキストに書き起こしたコンテンツ) の実際の提供のしかたですが、以下のような例があります。

特別な理由がなければ、基本的には、Web ページ (HTML による記述) でトランスクリプトを提供するのがよいと思います。というのも、モバイル機器を含め、ブラウザが入っているデバイスであれば、別途アプリを起動することなくトランスクリプトにスムーズにアクセスすることができるからです。

ただ、要件によってはトランスクリプトを印刷するケースを重視する場合もあると思いますので、ターゲットユーザーの行動シナリオを基に、適切な閲覧手段を提供するようにします。 (上記の例で挙げた「BBC Learning English - 6 Minute English」が PDF でトランスクリプトを提供しているのは、恐らく印刷を前提にしているからと思われます。語学教育系コンテンツの場合、比較的印刷のニーズが高いのでしょうか、たとえば「ECC 英会話 Podcasting」でも、トランスクリプトを印刷するボタンが設けられています。

トランスクリプトは情報保障として以外にも様々なメリットがある

トランスクリプトには、聴覚障害者向けの情報保障としてだけでなく、他にも様々なメリットがあります。

たとえば「音声が聞けない状況で、取り急ぎ内容をチェックしたい」という場合、書き起こされたテキストを見ることによって、内容を理解することができます。音声コンテンツの場合、実際に再生してみないと内容がわかりませんが、全体を書き起こされたトランスクリプトがあれば「まずはざっと一瞥してコンテンツの概要を把握し、興味があればあとでじっくり聞く」といったことも可能になります。ユーザーの利用方法の自由度を高めるという意味で、音声コンテンツに対するトランスクリプトは、ユーザビリティにも好影響を与えると言えるでしょう。

さらに、書き起こしたテキストを適切にマークアップすることで、SEO にもつながります。ユーザーが興味を持っている内容をキーワードとして含むコンテンツであれば、トランスクリプト (テキスト) を介する形で、検索エンジンからの流入も期待できます。

音声には、テキストコンテンツには無い、音声ならではの利点があると思います。音でこそ効果的に伝わる情報もあるでしょう。こうした利点を活かしてユーザーにより魅力的に/エモーショナルに情報を伝えたいという意図があれば、積極的に音声コンテンツを作るのがよいと考えます。その一方で、アクセシビリティの担保も比較的容易なので (音声の内容をテキストとして書き起こすだけ)、ぜひトランスクリプトを用意したいものです。