展示 14
AIによるニュース原稿分析システム
取材した情報をより早く届けるために
展示概要
人工知能(AI)技術を使った番組制作支援の研究を進めています。例えば、自然言語処理、音声認識、画像認識などです。ここでは、入力されたニュース原稿に対して内容を示すラベルの付与、キーワードの抽出や関連記事情報の提示を自動で行うシステムを展示しています。
研究の目的
制作現場の業務効率化や、視聴者が所望する情報への容易なアクセスを実現するため、ニュース原稿を分析し、必用な分類ラベルを自動で付与する技術の研究です。
課題
NHKでは、制作したニュース原稿を番組制作に活用するために、原稿データベースに保存・管理しています。原稿を探し出すためには分類ラベルが必用ですが、人手で分類するのは容易ではありません。また、視聴者の利便性を高めるため、分類ラベルはニュース記事とともにNHK NEWS WEBで公開されています。そのため、自動付与される分類ラベルの精度向上が課題です。
どんな技術?
当所では、人工知能(AI)技術を使って番組やニュースサイトといったコンテンツの効率的な制作を支援する技術を研究しています。
例えば、世の中の出来事をより早く、分かりやすく整理するためにSNS分析システムをこれまでに開発しています。また、番組素材を有効活用するための音声認識システム、画像認識システムにも取り組んでいます。
今回は、ニュース原稿を対象にさまざまな情報を付与するニュース原稿分析システムをご紹介します。
ニュース原稿に情報を付与する?
ニュースは書いたら終わりじゃない
世の中は常に変わり続けています。そして、放送局では日々大量のニュース原稿が生み出されては記事として発信されていきます。ニュース制作のワークフローでは、執筆された原稿の公平性や正当性を担保するために何人もの人間が関わっています。しかし、それは執筆された原稿の内容を何人もが読み込まなくてはならないことを意味します。それには大変な時間と労力がかかります。
そこで、ニュース原稿にひと目で分かりやすい情報を自動で付け加えるシステムが業務をサポートすることができれば、ワークフロー全体の時間と労力を削減することができます。
また、適切にカテゴライズされ、公開されたニュース記事は視聴者にとっても探しやすく、分かりやすいニュースサイトの構築にも寄与することができると考えています。
詳しい解説
ニュース原稿分析システムに用いられている技術の詳細を安田有希研究員がプレゼンテーションします。
- ニュース原稿の特性
- マルチラベルテキスト分類について
- ラベル共起※情報を加味した教師データの構築
※ 共起:ある文字列とある文字列が同時に出現すること
関連文献
- 「マルチラベル分類における共起情報を用いたラベル平滑化手法」第23回音声言語シンポジウムおよび第8回自然言語処理シンポジウム(2021)
- 「ニュース制作支援のための記事分析システムの構築」2021年映像情報メディア学会冬季大会(2021)
- 「入力文とラベル構造との関係に着目したマルチラベル分類手法」第19回情報科学技術フォーラム(2020)
- 「発話順序に基づく Graph Attention Networks を用いた 対話文における感情認識」自然言語処理28巻4号(2021)(NHKサイトを離れます)
- “Relation-aware Graph Attention Networks with Relational Position Encodings for Emotion Recognition in Conversations,” Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP 2020)(NHKサイトを離れます)
- “NHK_STRL at WNUT-2020 Task 2: GATs with Syntactic Dependencies as Edges and CTC-based Loss for Text Classification,” Proceedings of the 6th Workshop on Noisy User-generated Text (W-NUT 2020)(NHKサイトを離れます)