5628 鳥のささみ

ふだん、ひとりでいるときに、声を出して笑うということはないが、これは思わず声を出て笑ってしまった気がする。

イチローの引退会見を中継したネットテレビで使われた、自動文字変換の精度が、あまりに低く、想像を超えた内容となってしまったのだ。

会見の様子をリアルタイムで見ていないので、どうしてこういう結果になったのかわからないが、たとえばこれ…。

鳥のささみと申します。
鳥のささみと申しますなにがどうなって、鳥のささみが名乗るんだろう…と思ったら、笑いが抑えられなかった。

他にもこんな感じ

だが、「プロ」が「風呂」になったり、「ファン」が「パン」になるなど間違いが多く、「爆笑してしまう」「イチローがいいこと言ってるのに全く頭に入ってこない」など話題に。また、「人望」を一瞬、「ちんぼ」と表示するなど、致命的な間違いもあり、「字幕はいらなかったのでは」という声も聞かれた。

でも、NHKの生放送では、リアルタイムで字幕が出てて、それもほとんどミスらしいミスのない字幕だった気がするのだけど、どういうことなのだろう?…と思って、検索してみたら、こんな記事が見つかった。

NHKの字幕「音声自動認識率98%」のカラクリ

現在は番組によって4つの方式を使い分けています。まず、高速入力に適した特殊なキーボードを用いて、人力で字幕を起こす「キーボードリレー方式」。それから、番組音声を直接認識するシステムと、人力での作業を併用する「ハイブリッド方式」。そして、ニュースなど元原稿が存在する番組では、音声認識結果からどの原稿を読み上げているのかを推定して字幕化する「セレクト方式」も活用されています。

なんてことない、全自動というわけではなく、ちゃんと裏に人がいたのだ。

AIがもてはやされているが、まだまだ人間には敵わない…というより、当たり前のようにできてしまう人間のすごさを感じる。

コメントを残す

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください