The WebAIM Million (100万のホームページに対するアクセシビリティ自動検証) : 2025年の調査
ウェブアクセシビリティ向上のために活動している米国の非営利団体 WebAIM が実施した「The WebAIM Million」という調査があります。Tranco ランキング を基にメジャーどころの100万ウェブサイトを採り上げ、各サイトのホームページに対してウェブアクセシビリティ検証ツール「WAVE」のエンジンを用いて自動検証を行ない、定量的に傾向を分析するというものです。
今回、その第7回となる調査が、2025年2月に行なわれました。調査結果の詳細は WebAIM サイトの「The WebAIM Million - The 2025 report on the accessibility of the top 1,000,000 home pages」でご覧いただけますが、以下、抜粋してご紹介します。
全体的なエラー件数
100万ホームページでトータル50,960,288件のエラー、つまり1ホームページあたり平均で51件のエラーが検出されています。前回調査の56,791,260件 (1ホームページあたり平均で56.8件) に比べて1割ほど減少していることになります。
なお、ここで言うエラーとは、ウェブアクセシビリティ検証ツール「WAVE」が判定する「Errors」のことですが、エンドユーザーに与える影響が顕著で、WCAG 2 達成基準 (レベル A および AA) への不適合である可能性が極めて高いものとなります。
WCAG への不適合
94.8%のホームページで、何らかの WCAG への不適合が検出されるという結果になっています。2024年が95.9%、2023年が96.3%、2022年が96.8%、であったことを踏まえると着実に改善傾向にあると言えなくもありませんが、依然として9割を超えるホームページで WCAG 2 達成基準への不適合が見られるという状況が続いています。
WCAG 不適合の種類ごとに見てみると、主だったものとしては以下の通りです。いずれもアクセシビリティ要件として基本的なものばかりですが、検出された不適合のほぼすべて (96%) が下記の6種類のいずれかに該当しており、逆に言うとこれらの基本がしっかりできてさえいれば、アクセシビリティは劇的に改善されると言えるでしょう。
WCAG 不適合の種類 | 2025年 | 2024年 | 2023年 | 2022年 | 2021年 |
---|---|---|---|---|---|
低コントラストのテキスト | 79.1% | 81.0% | 83.6% | 83.9% | 86.4% |
画像の代替テキスト不備 | 55.5% | 54.5% | 58.2% | 55.4% | 60.6% |
フォーム入力要素のラベル不備 | 48.2% | 48.6% | 45.9% | 46.1% | 54.4% |
空のリンクラベル | 45.4% | 44.6% | 50.1% | 49.7% | 51.3% |
空のボタンラベル | 29.6% | 28.2% | 27.5% | 27.2% | 26.9% |
ページ全体の lang 設定不備 | 15.8% | 17.1% | 18.6% | 22.3% | 28.9% |
推移を俯瞰してみると、低コントラストのテキスト、ページ全体の lang 設定不備、については検出されるホームページの割合が減少傾向にあるものの、画像の代替テキスト不備、フォーム入力要素のラベル不備、空のリンクラベル、空のボタンラベル、については検出されるホームページの割合が減ったり増えたり、といった感じです。
テキストのコントラスト
上のテーブルが示すとおり、8割ものホームページで、WCAG が規定する最低限のコントラスト要件を満たさないテキストが見られます。ここ数年でこの割合は減りつつあるものの、依然としてこれは、もっともよく見られるアクセシビリティの問題と言えます。
なお、検出された低コントラストのテキストのインスタンス数の、1ページあたりの平均は、29.6という結果になっています (2024年調査の34.5に比べて14%減)。
画像および代替テキスト
上のテーブルが示すとおり、5割強のホームページで、画像の代替テキスト不備が見られます。
なお今回の調査対象では合わせて5,860万 (1ホームページあたり平均で58.6) の画像が検出され、このうち18.5%に代替テキストの不備 (alt
属性の欠落) が見られるという結果になっています。このうち44%はリンク画像で、これはリンク画像全体から見ると1/5にのぼるようです。
一方、代替テキストがある (alt
属性がある) 画像のうち13.4%は、その内容に問題が見られるという結果になっています (単に「画像」と書いてあったり、ファイル名だったり、隣接するテキストと重複する内容だったり、など)。
総じて言うと、検出された画像の3割が、代替テキストに関する問題を抱えている (alt
属性が欠落している、または alt
属性の記述が適切でない) ことになります。
フォーム入力要素のラベル
上のテーブルが示すとおり、5割弱のホームページで、フォーム入力要素のラベル不備が見られます。
なお今回の調査対象では合わせて630万 (1ホームページあたり平均で6.3) のフォーム入力要素が検出され、このうち34.2%は適切なラベル付けがなされていない (<label>
要素、aria-label
属性、aria-labelledby
属性、title
属性のいずれも実装されていない) という結果になっています。
見出し
今回の調査対象では合わせて2,500万 (1ホームページあたり平均で25) の見出し (<h1>
- <h6>
) が検出されています。
なお、複数の <h1>
要素が存在するホームページの割合は16.3%、見出しレベルのスキップ (例 : <h2>
の次は <h3>
ではなく <h4>
といった具合) が見られるホームページの割合は39%、見出しがひとつもないホームページの割合は9.8%、という結果になっています。
ARIA
今回の調査対象では合わせて105,509,338の ARIA 属性が検出されており、平均して1ホームページあたり106もの ARIA 属性が存在することになります。これは対前年比で18.5%の増加、2019年と比べると約5倍という結果です。
なお、ARIA 属性 (ランドマークを除く) が用いられているホームページの割合は79.4%です。これら ARIA 属性が存在するホームページでは平均で57件のエラーが検出されています。そうでないホームページ (平均で27件のエラー) に比べて、2倍以上のエラーが生じていることになります。
曖昧なリンクテキスト
今回の調査では、13.7% のホームページで、曖昧なリンクテキスト ("click here" や "more" など) が見られました (2024年調査の13.2%に比べて若干増えています)。なお、これらのページでは、1ページあたりに見られる曖昧なリンクテキストのインスタンス数が平均で6.8にのぼります (これも2024年調査の6.3から増えています)。
その他
その他、以下の興味深い結果も見られました。
- 80.5%のホームページで、1つ以上のランドマークが実装されています。ただし「メイン」ランドマーク (
<main>
またはrole="main"
) を持つホームページは、その半数 (42.6%) にとどまっています。 - サイトカテゴリー別の平均エラー件数がランキングとしてまとめられています。もっともランクの高いカテゴリーが「Government (政府機関のウェブサイト)」なのはさもありなんという感じですが、もっともランクが低いカテゴリーが「Shopping (ショッピングサイト)」というのは意外な印象を受けました。
以上です。全体的な傾向として、エラー (WCAG への不適合) が検出されるホームページの割合が、少しずつながらも着実に減ってきているのは、よいことだと思います。その一方で、アクセシビリティ要件として基本的なことが、依然としてほとんどのホームページでできていないことは、大きな課題であると言えるでしょう。また、ARIA の使用が飛躍的に増えて今や8割近くのホームページに ARIA 属性が存在すること、そしてこれら ARIA 属性が存在するホームページではアクセシビリティの問題がより多く見られる傾向があることは、これからも注視してゆく必要がありそうです。