The WebAIM Million (100万のホームページに対するアクセシビリティ自動検証) : 2024年の調査

ウェブアクセシビリティ向上のために活動している米国の非営利団体 WebAIM が実施した「The WebAIM Million」という調査があります。Tranco ランキング などを基にメジャーどころの100万ウェブサイトを採り上げ、各サイトのホームページに対してウェブアクセシビリティ検証ツール「WAVE」のエンジンを用いて自動検証を行ない、定量的に傾向を分析するというものです。

今回、その第6回となる調査が、2024年2月に行なわれました。調査結果の詳細は WebAIM サイトの「The WebAIM Million - The 2024 report on the accessibility of the top 1,000,000 home pages」でご覧いただけますが、以下、抜粋してご紹介します。

全体的なエラー件数の推移

100万ホームページでトータル56,791,260件のエラー、つまり1ホームページあたり平均で56.8件のエラーが検出されています。2021年、2022年、2023年と概ね平均50件あたりだったところ、今回になって著しく増加した形です。

なお、ここで言うエラーとは、ウェブアクセシビリティ検証ツール「WAVE」が判定する「Errors」のことですが、エンドユーザーに与える影響が顕著で、WCAG 2 達成基準 (レベル A および AA) への不適合である可能性が極めて高いものとなります。

WCAG への不適合

95.9%のホームページで、何らかの WCAG への不適合が検出されるという結果になっています。2023年が96.3%、2022年が96.8%、2021年が97.4%であったことを踏まえると着実に改善傾向にあると言えなくもありませんが、依然としてほぼ100%近いホームページで WCAG 2 達成基準への不適合が見られるという現実はあまり変わっていないとも言えます。

主な WCAG 不適合の種類ごとに見てみると、以下の通りです。いずれもアクセシビリティ要件として基本的なものばかりですが、検出された不適合のほぼすべて (96.4%) が下記の6種類のいずれかに該当しており、逆に言うとこれらの基本がしっかりできてさえいれば、アクセシビリティは劇的に改善されると言えるでしょう。

WebAIM Million の調査対象となった100万ホームページ中で、各種 WCAG 不適合が検出されたページの割合。
WCAG 不適合の種類2024年2023年2022年2021年2020年
低コントラストのテキスト81.0%83.6%83.9%86.4%86.3%
画像の代替テキスト不備54.5%58.2%55.4%60.6%66.0%
フォーム入力要素のラベル不備48.6%45.9%46.1%54.4%53.8%
空のリンクラベル44.6%50.1%49.7%51.3%59.9%
空のボタンラベル28.2%27.5%27.2%26.9%28.7%
ページ全体の lang 設定不備17.1%18.6%22.3%28.9%28.0%

推移を俯瞰してみると、低コントラストのテキスト、画像の代替テキスト不備、空のリンクラベル、ページ全体の lang 設定不備、については検出されないホームページの割合が少しずつ増えつつあるものの、フォーム入力要素のラベル不備、空のボタンラベル、については検出されるホームページの割合が減ったり増えたり、といった感じです。

テキストのコントラスト

上のテーブルが示すとおり、8割ものホームページで、WCAG 達成基準 (AA) を満たさない低コントラストのテキストが見られます。ここ数年でこの割合は減りつつあるものの、依然としてこれは、もっともよく見られるアクセシビリティの問題と言えます。

なお、検出された低コントラストのテキストのインスタンス数の、1ページあたりの平均は、34.5という結果になっています。

画像および代替テキスト

上のテーブルが示すとおり、5割強のホームページで、画像の代替テキスト不備が見られます。

なお今回の調査対象では合わせて5,560万 (1ホームページあたり平均で55.6) の画像が検出され、このうち21.6%に alt がないという結果になっています。ちなみに alt がない画像のうち43%はリンク画像で、これはリンク画像全体から見ると1/4にのぼるようです。

一方、代替テキストがある画像のうち14.6%は、その内容に問題が見られるという結果になっています (単に「画像」と書いてあったり、ファイル名だったり、隣接するテキストと重複する内容だったり、など)。

フォーム入力要素のラベル

上のテーブルが示すとおり、5割弱のホームページで、フォーム入力要素のラベル不備が見られます。

なお今回の調査対象では合わせて620万 (1ホームページあたり平均で6.2) のフォーム入力要素が検出され、このうち35.5%は適切なラベル付けがなされていない (<label> 要素、aria-label 属性、aria-labelledby 属性、title 属性のいずれも実装されていない) という結果になっています。

見出し

今回の調査対象では合わせて2,380万 (1ホームページあたり平均で24) の見出し (<h1> - <h6>) が検出されています。

なお、複数の <h1> 要素が存在するホームページの割合は16.8%、見出しレベルのスキップ (例 : <h2> の次は <h3> ではなく <h4> といった具合) が見られるホームページの割合は37.9%、見出しがひとつもないホームページの割合は11.3%、という結果になっています。

ARIA

今回の調査対象では合わせて89,050,856の ARIA 属性が検出されており、平均して1ホームページあたり89もの ARIA 属性が存在することになります。これは対前年比で15%の増加、2019年と比べると4倍以上、という結果です。

なお、ARIA 属性 (ランドマークを除く) が用いられているホームページの割合は74.6%です。これら ARIA 属性が存在するホームページでは、そうでないホームページに比べて、平均して34.2%も多くのエラーが検出されています。ARIA の不適切な実装がかえってアクセシビリティを損ねている可能性がありますが、前回調査ではこの比率が68.6%だったことを考えると、ARIA の不適切な実装は減ってきているというとらえかたもできるかもしれません。

その他

その他、以下の興味深い結果も見られました。

アクセシビリティオーバーレイは「WAVE」の検証結果を不当に操る恐れがあり、本調査はオーバーレイを無効化した状態で実施されたそうです。なお、調査対象の100万ホームページのうち、オーバーレイを導入しているサイトの割合がどの程度なのか (ごくわずか?それなりに多い?)、今回の調査結果では言及がなかったので、気になるところです。