ホーム 研究内容 ニュース 刊行物 アクセス

研究内容紹介

4.1 ソーシャル・ビッグデータ解析技術

ソーシャルメディア分析技術

 放送局が取り扱う大量のテキストデータ、いわゆるテキストビッグデータから番組制作に役立つ情報を取得する研究を進めている。ニュース制作現場では、テキストビッグデータの一つであるソーシャルメディアへの投稿から、ニュース性のある情報を取得している。そのため、技研では、現場で得られたニュース性のある投稿を教師データとし、ツイッターからニュース性のある投稿をリアルタイムに自動で取得するシステムの開発を行っている。このシステムは、ニューラルネットワーク(NN)を用いて、大量のツイートからニュース性のある情報を抽出する。現状では、システムが特定するニュース性のある投稿は1日数千件にも及ぶため、自動判定したツイート内容のニュースカテゴリと地名情報により、抽出された投稿を分類するユーザーインタフェース(図4-1)を開発した(1)。さらに、事件や事故の発生場所の特定機能を改善するため、知識ベースを活用したNNによる投稿者の位置情報の推定手法の検討を進めた(2)
 システムが特定したニュース性のあるツイートの中には、既に他のメディアで報道されている情報やそのコメントやリツイートが含まれている場合がある。それらを判別できるように、畳み込みNNを用いて、既出の情報を特定する手法を開発した(3)。また、ソーシャルメディアには、ボットと呼ばれる自動投稿を行うアカウントが多数存在している。ボットの投稿には、過去の投稿のコピーや、デマやいわゆるフェイクニュースも含まれており、ある投稿のアカウントがボットどうかの情報は番組制作者にとって重要である。そこで、ソーシャルメディアへの投稿時刻の規則性に基づき、ボットのアカウントを判定する手法を開発した(4)
 ツイッターには世の中で起こっている種々の事件や事故に関する投稿がされており、固定のモデルでは対応できない場合も考えられる。そのため、システム利用者の操作ログをもとに新たな学習データを作成し、そのデータを利用してモデルを更新するためのNNの構成を検討した(5)。また、事件や事故に関する投稿には、火災や交通事故などを表す文字情報がなく、画像のみを添付している場合があるため、テキスト分析だけでなく、4.2節で紹介する画像分類技術を用いて、該当ツイートを抽出する機能を検討しシステムに実装した。
 放送局には過去に制作した番組に関する情報が蓄積されており、新たな番組を制作する上でこれらの情報は有用である。そこで、単語間の関係辞書を利用した文章間の関連性を判定する手法を用いて、取得したソーシャルメディアへの投稿をもとに、関連する過去の番組の情報を検索・提示する機能(図4-2)を開発した(6)
 開発したソーシャルメディア分析システムの可視化機能や分析機能を用いて、視聴者からの意見を反映させる生放送番組(テンゴちゃん、はじっこ革命)や年末特集番組(ドキュメント72時間)に活用した。また、米国NIST(National Institute of Standards and Technology)が主催する競争型ワークショップTREC 2018の災害関連トラックに参加し、上位の成績(分類タスク4位、重要度判定タスク1位)を獲得した(7)



図4-1 ソーシャルメディア分析システムのユーザーインタフェース

図4-2 ソーシャルメディアの投稿に基づく関連番組検索

評判分析技術

 番組に関する評判を放送後に網羅的・恒常的に分析する技術の研究を進めている。番組に関する評判には、番組の内容に関する純粋な意見の他に、編成や経営に関わる要望など、固有な意見種別がある。このような、視聴者意見分析の実務に基づいた分類ができるアルゴリズムを、関連部局での利用が可能な分析システムとして実装した。
 番組に関する評判であることを判断するための大切な要素のひとつである、意見対象の検出技術を開発するための課題を洗い出した。ソーシャルネットワーキングサービス(SNS)を利用した既存の手法には、番組ハッシュタグと呼ばれる、ツイッター利用者固有の記法を手掛かりにするものがある。番組ハッシュタグは、ソーシャルメディアでの利用法の変遷や放送局の運営指針の変更により影響を受けるため、網羅的・恒常的な分析を可能とするには、番組ハッシュタグに過度に依存しない手法の開発が必要である。そのため、番組ハッシュタグを用いる手法の得失を調査し、一般的な言語処理技術を手掛かりとする手法の検討を行った。


 

〔参考文献〕
(1) 武井,牧野,宮崎,住吉,後藤:“ニュース取材支援のためのソーシャルメディア分析システム,” FIT 2018, E-015(2018)
(2) T. Miyazaki,A. Rahimi, T. Cohn and T. Baldwin:“Twitter Geolocation using Knowledge-Based Methods,” W-NUT2018, pp.7-16(2018)
(3) K. Makino,Y. Takei,T. Miyazaki and J. Goto:“Classification of Tweets about Reported Events using Neural Networks,” W-NUT2018, pp.153-163 (2018)
(4) 岡本,宮﨑,後藤:“統計的手法に基づいたウェブサービスにおけるbot検出,” 情処全大, 7K-02 (2019)
(5) 牧野,武井,岡本,宮崎,後藤:“ニュース価値のあるTweet抽出に向けたマルチタスク学習の一検討,”映情学冬大, 12C-3(2018)
(6) 宮崎,牧野,武井,住吉,後藤:“番組制作支援のためのTweet→TV番組検索システム,” 映情学年次大, 13B-5(2018)
(7) T. Miyazaki, K. Makino,Y. Takei,H. Okamoto and J. Goto: “NHK STRL on the IS track of the TREC 2018,”TREC 2018 (2018)