The WebAIM Million (100万のホームページに対するアクセシビリティ自動検証) : 2023年の調査

ウェブアクセシビリティ向上のために活動している米国の非営利団体 WebAIM が実施した「The WebAIM Million」という調査があります。The Majestic MillionAlexa Top SitesDomCop Top 10 million domains を基にメジャーどころの100万ウェブサイトを採り上げ、ウェブアクセシビリティ検証ツール「WAVE」のエンジンを用いて自動検証を行ない、定量的に傾向を分析する、というものです。

今回、その第5回となる調査が、2023年2月に行なわれました。調査結果の詳細は WebAIM サイトの「The WebAIM Million - The 2023 report on the accessibility of the top 1,000,000 home pages」でご覧いただけますが、以下、抜粋します。

全体的なエラー件数の推移

100万ホームページでトータル49,991,225件のエラー、つまり1ホームページあたり平均で50.0件のエラーが検出されています。2022年が平均50.8件、2021年が平均51.4件であったことを踏まえると少しずつ改善傾向にあると言えるかもしれませんが、WAVE によるエラー (エンドユーザーに与える影響が顕著で、WCAG 2 達成基準のレベル A や AA への不適合である可能性が極めて高いもの) の検出が1ホームページあたり50近くもある、というのは依然として大きな課題と言えるでしょう。

WCAG への不適合

96.3%のホームページで、何らかの WCAG への不適合が検出されています。2022年が96.8%、2021年が97.4%であったことを踏まえると少しずつ改善傾向にあると言えなくもありませんが、依然としてほぼ100%近くのホームページで WCAG 2 達成基準への不適合が見られるという現実は、残念と言わざるをえません。

主な WCAG 不適合の種類ごとに見てみると、以下の通りです。テキストのコントラストを筆頭に、いずれも基本的なことばかりですが、検出された不適合のほぼすべて (96.1%) が下記の6種類のいずれかに該当しており、逆に言うとこれらの基本がしっかりできてさえいれば、ウェブ全体のアクセシビリティは劇的に改善されると言えるでしょう。

WebAIM Million の調査対象となった100万ホームページ中で、各種 WCAG 不適合が検出されたページの割合。
WCAG 不適合の種類2023年2022年2021年2020年2019年
低コントラストのテキスト83.6%83.9%86.4%86.3%85.3%
画像の代替テキスト不備58.2%55.4%60.6%66.0%68.0%
空のリンクラベル50.1%49.7%51.3%59.9%58.1%
フォーム入力要素のラベル不備45.9%46.1%54.4%53.8%52.8%
空のボタンラベル27.5%27.2%26.9%28.7%25.0%
ページ全体の lang 設定不備18.6%22.3%28.9%28.0%33.1%

テキストのコントラスト

上のテーブルが示すとおり、83.6%のホームページで、WCAG 達成基準 (AA) を満たさない低コントラストのテキストが見られます。

なお、各ページあたりで見ると、低コントラストのテキストのインスタンスは、平均して30.4箇所という結果になっています (2022年の調査では平均で31.7箇所)。

画像および代替テキスト

上のテーブルが示すとおり、58.2%のホームページで、画像の代替テキスト不備が見られます。

なお今回の調査対象では合わせて4,300万以上の画像 (1ホームページあたり平均43.4枚の画像) が検出され、このうち22.1%、つまり1ホームページあたり平均9.6枚の画像で、alt 属性の不備があるという結果になっています (alt があって属性値が空のものは除く)。その半数以上はリンク画像であり、スクリーンリーダーのユーザーにとっては、リンクラベルのない意味不明なリンク、ということになります。

一方、代替テキストがある画像のうち10.9%は、alt 属性があってもその内容に問題が見られる、という結果になっています (単に「画像」と書いてあったり、ファイル名だったり、隣接するテキストと重複する内容だったり、など)。

フォーム入力要素のラベル

上のテーブルが示すとおり、45.9%のホームページで、フォーム入力要素のラベル不備が見られます。

なお今回の調査対象では合わせて500万ほどのフォーム入力要素が検出され (2022年の440万から13.8%の増加)、このうち35.8%は適切なラベル付けがなされていない (<label> 要素、aria-label 属性、aria-labelledby 属性、title 属性のいずれも実装されていない) という結果になっています。2022年が39%、2021年が45%、2020年が55%、2019年が59%であったこと、またフォーム入力要素自体の数が増えていることも踏まえると、着実に改善傾向にあると言えるかもしれません。今後のさらなる改善に期待したいところです。

見出し

100万ホームページでトータル2,470万以上 (つまり1ホームページあたり平均で24以上) の見出しが検出されています。2022年の2,320万から6.8%増加し、2019年の1,890万との比較では31%の増加になります。HTML の見出し要素 (<h1> - <h6>) を用いた構造化は、着実に進んでいると言えそうです。

ただ、20.1%のホームページで複数の <h1> 要素が存在する 、42.2%のホームページで見出しレベルのスキップ (例 : <h2> の次は <h3> ではなく <h4> といった具合) がある、7.9%のホームページで見出し要素がまったく存在しない、という結果も併せて見られます。

ランドマーク

80.9%のホームページで、1つ以上の WAI-ARIA ランドマーク (暗黙的なものも含む) が実装されています。2022年が75.3%、2021年が69.1%、2020年が68.9%、2019年が62.4%であったことを踏まえると、ランドマークの実装は着実に普及していると言えそうです。

41.5%のホームページに「メイン」ランドマーク (<main> または role="main") が存在しています (2022年は36%)。そのほぼすべて (96%) が1つだけの「メイン」ランドマークを持ちます (正しい実装です)。

21%のホームページに「検索」ランドマーク (role="search") が存在しています (2022年は19.9%)。

「ナビゲーション」ランドマーク (<nav> または role="navigation") が存在するホームページでは、平均で2.4個のナビゲーションのリージョンがあります (2022年は2.3個)。

ARIA

今回の調査では、77,437,071 個の ARIA 属性が検出されています。平均して1ホームページあたり77個の ARIA 属性が存在することになります。対前年比で29%の増加、2019年と比べると約4倍に増えている、という結果です。

実際に ARIA 属性 (上述のランドマークを除く) が存在するホームページは80%にのぼり、2022年が74.6%、2021年が68.1%、2020年が64.6%、2019年が60.1%であったことを踏まえると、ARIA を実装するサイトが着実に増えていることがうかがえます。ただし、ARIA 属性が存在するホームページでは、そうでないホームページに比べて、平均して68.6%も多くのエラーが検出されているという結果もあり、ARIA の不適切な実装がかえってアクセシビリティの阻害につながっているケースが多そうです。

各ホームページには平均して15.2個の aria-labelaria-labelledby または aria-describedby 属性があります。こうした ARIA を介したラベルや説明の実装は、対前年比で28%増加しています。

各ホームページには平均して13.7個の aria-hidden="true" 属性があり (2022年は11.0個、2021年は8.9個、2020年は6.6個)、インタラクティブにコンポーネントの表示/非表示を切り替える UI の増加がうかがえます。

5%のホームページに ARIA メニュー (role="menu") がありますが、このうち31% で、関連する ARIA のマークアップ (たとえば role="menuitem") やポップアップなどのインタラクションで必要な実装に不備があり、かえってアクセシビリティの障壁につながっています。

あいまいなリンクラベル

17.3%のホームページであいまいなリンクラベル (click here、more、continue など) が見られ、また、これらのページにおいては各ページあたり平均で5.3個のあいまいなリンクラベルのインスタンスが検出されています。2022年の調査ではそれぞれ18%、5.9個だったので、わずかながら改善されていると言えるかもしれません。

その他

その他、以下の興味深い結果も見られました。