ホーム 研究内容 ニュース 刊行物 アクセス

研究内容紹介

5.4 言語処理技術

 日本在住の外国人を対象とした新たな情報提供手段として、読解支援情報付きニュースの研究を進めている。また、外国語コンテンツ制作の効率化を目指した機械翻訳の研究を開始した。


読解支援情報付きニュース

 インターネットで公開している日本語テキストのニュースには、難しい漢字や表現が頻出するため、多くの外国人にとって理解することが容易ではない。そこで、ニュースにさまざまな「読解支援情報」を付加することで、外国人のニュースの理解を促進する研究を進めている。読解支援情報として、難しい表現に対するやさしい日本語の解説、漢字のふりがな、難しい単語に対する辞書情報を用意した。読者は、スライダーやボタンの操作で読解支援情報の表示を調節できる。
 読解支援情報のうち、やさしい日本語の解説は機械翻訳システムによって自動付与し、ふりがなと辞書情報は形態素解析システムによって自動付与するが、自動付与には誤りが避けられない。そこで誤りを簡便に修正するためのインターフェースを開発し、実際に読解支援情報付きニュースを簡便に制作できることを確認した(1)
 このほか、知的障害者に対するやさしい日本語の効果の検証を目指した比較分析を実施した。具体的にはNHKのインターネットニュース「NEWSWEB」、やさしい日本語のニュース「NEWSWEB EASY」、および福祉団体が発行する知的障害者向けの新聞「ステージ」の同一話題の記事を分析した(2)。この結果、NEWSWEBに比べてNEWSWEB EASYとステージはやさしい語が多く使われていることや、文が短いことが明らかになった。また、NEWSWEB EASYとステージには、専門用語の出現に差があることが明らかになった。この研究は淑徳大学短期大学部、聖心女子大学、公立はこだて未来大学と共同で実施した。


機械翻訳技術

 NHKワールドのビデオオンデマンド(VOD)旅番組のスペイン語字幕制作支援を目的に、英語−スペイン語の機械翻訳の研究を開始した。NHKのラジオ日本の5年分の台本を元に約5万文の英語−スペイン語の対訳データを整備し、さらにインターネット上で公開されている言語データから約500万文の対訳データを整備した。以上の対訳データを元に、ニューラルネット翻訳システムを試作した。VOD旅番組の字幕の翻訳実験を実施したところ、翻訳システムを使用した場合、人手の翻訳に比べて単位時間の翻訳量を1.6倍に増加させることができた。また、局内からアクセスできる翻訳システムのWebインターフェースを整備した(図5-6)。このほか、日英ニュース機械翻訳の研究のため、人手の翻訳により4万文の日英ニュース対訳データを整備した。この研究は情報通信研究機構と共同で実施した。



図5-6 英語−スペイン語翻訳システム

 

〔参考文献〕
(1) 後藤,美野,熊野,田中:“読解支援情報付きニュースの提案,” 2017年映情学冬季大,22A-8(2017)
(2) 打浪,岩田,熊野,後藤,田中,大塚:“障害者向け「わかりやすい」情報提供と外国人向け「やさしい日本語」の相違−「ステージ」と「NEWSWEB EASY」の語彙に着目した比較分析から−,” 社会言語科学,Vol. 20, No. 1, pp.29-41(2017)