学校放送・ICT活用! 先生応援サイト

放送教育ネットワーク

 聴覚障害者向け番組には、前回述べたような手話番組のほかに、テレビの音声内容を理解できるように字幕をつけた番組がある(写真1)。
 今回は、イギリスの字幕番組について書くことにする。イギリスでは、イギリスの英国放送協会(BBC)、インデペンデント・テレビジョン委員会(ITC)、2つの字幕制作会社、それに3つの聴覚障害者団体を、この1月に訪問取材した。

 テレビ番組が、耳の聞こえない人にも理解できるようにと、字幕を付ける作業は、文字多重放送という新技術の開発と同時に始まったといえるだろう。筆者は、昭和50年代初頭にBBCを訪問したが、その頃からBBCの字幕放送は始まったようである。
 当初は、字幕がついているのは週に数番組というレベルであったが、利用者つまり聴覚障害者の強い要望に応えて、年々字幕番組は増えていった。その後、BBCの字幕番組比率は上昇し、2002年には字幕付加率70%を越えた。イギリスの1996年放送法では「地上波の場合は、2008年までに字幕付加率80%を達成しなければならない」と定められているが、BBCではこの基準をはるかに越えて、2008年には100%の番組に字幕を付けると公表している。
 字幕は、当初は録画してある番組のビデオ・テープを見ながら、放送の数日前に字幕を作成し、それをオン・エアしていた。ところが、この方式では、ニュースやスポーツ中継には字幕付加ができないことになる。それでは聴覚障害者の要望に応えられないので、生番組に字幕を付ける技術が、この2~3年急速に進歩してきた。
 BBCでは現在、事前に字幕を制作する場合と、番組の放送と同時に字幕を作り放送する生字幕とが、およそ半々であるという。後者をイギリスでは、生字幕(live subtitling) といっている。


 7年前に筆者がBBCを再訪した時は、生字幕はニュース専用で、その制作室はニューズ・ルームの一角にあった。それは、5~6人が中に入れば一杯になるような小部屋であった。しかし現在は、小学校の教室の2倍くらいの大きな部屋になっており、そこにナマ入力のブースが4つあった。そこで、アナログ番組とデジタル番組の双方に、生字幕を付けていた。この7年間に生字幕の番組が、急増したことがわかる。
 生放送に字幕を付ける方法は2つある。1つはステノグラフの利用であり、他の1つは音声認識技術によるものである。

 ステノグラフとは、14個のキーがある特殊なキーボードを用いた入力機である(写真2)。これは、英語のアルファベットを入力するのではなく、音素を入れるのである。たとえば、[THE]であれば、[T] [H] [E]の3つのキーボードを打つのではなく、「ザ」という音のキーボード1個を叩くだけですむのだという。これはイギリスの裁判所速記に用いられている機械を、放送用に改良したものである。
 生字幕の番組は2人で入力する。ブースの中の左側に録画入力・再生機があり、右側にステノグラフが設置されている。そして、それぞれの入力者がパソコン画面を見ながらキーボードを打っている。ブースの中には、この2人がいるだけである。
 ニュースであっても、多くの題材は放送時刻の数十分あるいは数時間前に決定されており、ニュース原稿もすでにできている。また夕方6時のニュースと同じ内容が10時に放送されることもある。このように、放送原稿が完成していて事前に字幕入力可能の題材を扱うのが、録画入力・再生機である。
 録画字幕入力者は、ニュース放送開始の前に、ニュース映像をコンピュータから引き出し、ニュース原稿を見、録音された音声があれば、それを聞きながら字幕を作成しておく。そしてニュース放送時刻になると、放送中の映像の進行に合わせ、出力キーを押すのである。そうすると、事前に準備された字幕が次々に放送されるという仕組みである。30分ニュースのうち、およそ3分の2の字幕は事前に制作し、生で送出している字幕であるという。そして、3分の1が、アナウンスを聞きながらステノグラフで入力する字幕である。
 筆者は、午後6時のニュース放送の送出に立ち会った。字幕入力者のレシーバーと同じレシーバーを掛けさせて貰い、ニュースの送出と生字幕入力の緊迫した雰囲気を体験することができた。
 イギリスの民放では、ITFCという会社に委託して、ニュースや討論番組に生で字幕を付加している(写真3)。ここでは、ステノグラフではなく、ヴェロタイプという機械を使用していた。これは、キーボード入力である。聴覚障害者団体の責任者に取材してみたが、BBCのステノグラフ方式とヴェロタイプ方式は、一長一短であるという。

 テレビの音声を、コンピュータが認識し、音を自動的に字幕に転換させるのが音声認識字幕である。日本でもNHKや民放で実用化されている。
 BBCの音声認識装置の使い方は、アナウンサー(あるいは出演者)の声を、コンピュータが直接認識して字幕にするというものではない。音声入力担当者が、写真のようにレシーバーを掛け、そこから聞こえてくる放送の音声を、マイクの前で即座に反復してしゃべり、その声をコンピュータは認識して文字にするものである(写真4)。そうすると3~4秒の遅れで、画面に字幕が表示される。
 文章が終わるところで「full stop 」といえば[.]が表示され、疑問符の終わりには「question mark」と叫んで[?]を表示させる。改行や[!]も、すべて音声で入力できる。現在のところ、普通の話し方であれば98%の正確度であるという。
 音声認識の字幕は、まだまだ開発の途中であるというのが、担当者の意見である。現在のところ、BBCには音声認識字幕室は2つしかない。しかし、2008年までに100%の番組に字幕をつけるというBBCの公約を達成するためには、音声認識字幕が重要な役割を果たすだろう。将来ステノグラフにとって代われば、人件費が少なくてすむだろうというのが、BBCの意見である。
 最近は、聴覚障害者から、質の高い字幕が強く要求されているという。質の高い字幕とは、良い会話文であり、文法的に正しく、かつ美しい要約文であること、聴覚障害者にとって読みやすいこと、画面の話者の口を文字で隠さないこと、字幕の色わけが適切であること、ベルの音、風の音等についてもきめの細かい配慮がしてあることなどであり、要するに聴覚障害者の気持ちになって字幕を作ることが大切であるという。
 イギリスの聴覚障害者団体は、BBCや民放の字幕を常に細かくチェックしており、字幕に不満があると、すぐ団体の機関紙などに発表される。また、字幕の質についての社会調査も実施している。イギリスを代表する公共放送のBBCとしては、番組の質においても字幕の質においても、民放に遅れを取るわけにはいかないという。
 なお、字幕の質についての調査や、聴覚障害者向け番組についての研究会等の実施に関して、BBCは積極的に協力している。
ページトップへ