Apple「ポッドキャスト」アプリのトランスクリプト自動生成

音声によって伝達されるコンテンツは、そのままでは聴覚障害者が利用できないため、視覚的に見えるテキストの形で代替コンテンツを提供することが、アクセシビリティの観点で求められます。たとえば動画であればキャプション (字幕)、ポッドキャストのようなオーディオコンテンツであればトランスクリプト (書き起こしテキスト) が、こうした代替コンテンツに該当します。

YouTube、Chrome ブラウザ (Windows および Mac) 、Android OS といった Google 系のプロダクトでは既に、自動の字幕起こし機能が用意されていて、便利に利用されている方も多いかと思います。これに対して、このほど Apple でも iOS (および iPad OS) のバージョン17.4で、Apple 純正「ポッドキャスト」アプリにおいて、トランスクリプトの自動生成が利用できるようになりました (本記事の執筆時点では、日本語への対応は、まだなされていません)。

Apple 公式のニュースリリース「Apple introduces transcripts for Apple Podcasts」によると、トランスクリプトはポッドキャストのエピソードが公開されたところで Apple 側で作り溜めされる形になっているようです。

Transcripts will automatically be available for new episodes shortly after episodes are published. Previously released episodes will be transcribed over time. (トランスクリプトは、新しいエピソードが公開された直後に自動的に利用可能になります。過去に公開されたエピソードは順次書き起こされます。)

実際に、iPhone で Apple 純正「ポッドキャスト」アプリを試してみました。エピソードを再生する画面で、「文字起こしを表示」(ダブルクォーテーションマークのアイコン) を押してアクティブにすると、トランスクリプトが表示されます。エピソードの再生と同期して、書き起こされたテキストの再生中の部分がリアルタイムに強調表示されるようになっています。

iPhone「ポッドキャスト」アプリでトランスクリプトを表示している例。エピソードの再生と同期して、リアルタイムに文字色が高コントラストに変わってゆく。
iPhone「ポッドキャスト」アプリでトランスクリプトを表示している例

トランスクリプト内のテキストは、検索することもできます。これにより、気になった語句が話されている箇所を、素早く見つけ出すことができます。

iPhone「ポッドキャスト」アプリでトランスクリプト内のテキストを検索した例。検索語句にマッチした箇所が反転表示される。
iPhone「ポッドキャスト」アプリでトランスクリプト内のテキストを検索した例 (「apps」という文字列で検索をしている)

個人的に便利に感じたのは、トランスクリプトの任意の箇所をタップすることで、その段落から再生が開始されることです。たとえば、たった今聞き逃してしまった発話を繰り返し聞いたり、あるいは段落から段落へ飛ばし読みをしたり、といったことが手軽にできるようになっています。トランスクリプトを単に表示させるだけでなく、インタラクティブに直接操作できるインターフェースとしてもさりげなく機能させているところが、いかにも Apple らしく面白いと思います。