No.121 2010年5月発行

コンテンツ活用技術 特集号

※PDFで公開しています。

巻頭言

  • コンテンツ活用技術への期待
    長谷山美紀 北海道大学大学院情報科学研究科教授
    PDF ↓概要

    概要
    小さな頃見ていた『ひょっこりひょうたん島』を思い出す。「波をチャプチャプチャプチャプかきわけて」で始まる主題歌は,今も歌うことができる。火山爆発で,突然動き始めた「ひょうたん島」は大海をさまようことになる。遠足で「ひょうたん島」に来ていた子供たちと先生,そして不思議な住人たちが,流れ着く先々で問題に直面しながらも皆で解決していく。もちろん,物語の詳細は時の経過とともに忘れてしまった。それでも,『ひょっこりひょうたん島』を見て楽しく過ごした時間は今でも鮮明に覚えている。

解 説

  • コンテンツ活用技術の概要
    藤井真人 / 柴田正啓
    PDF ↓概要

    概要
    放送と通信が連携した仕組みを利用して,放送局が制作し保有している大量の映像コン テンツを視聴者や利用者が使いやすい方法で提供することが求められている。このため には,映像コンテンツが意味内容に基づいて検索できることが基本となる。本稿では, 映像コンテンツを活用して新しいサービスを展開していくための内容解析や検索・推薦 の技術について,その考え方と研究開発の動向について概観する。
  • コンテンツを自動的に推薦するテレビ
    住吉英樹 / 佐野雅規 / 後藤淳 / 望月貴裕 / 宮崎勝 / 藤井真人 / 柴田正啓 / 八木伸行
    PDF ↓概要

    概要
    ビデオオンデマンドサービスなど,大量の映像へのアクセスが容易になっている今日, 新しいテレビの見方を実現することを目指して開発したコンテンツ推薦テレビの概要と 拡張性を持たせたシステムモデルについて紹介する。コンテンツ推薦テレビでは,視聴 中のコンテンツに関連したコンテンツをメタデータを利用して自動で検索し,推薦する。 複雑な検索操作は不要で,テレビ視聴者の多様な好奇心を満たし,興味を拡大するコン テンツを推薦することができる。
  • メタデータ制作フレームワーク
    佐野雅規 / 住吉英樹 / 藤井真人 / 柴田正啓 / 八木伸行
    PDF ↓概要

    概要
    所望の映像コンテンツをより速くより正確に取得したいという要望を満たすためには, 映像コンテンツに検索のためのメタデータ(内容記述情報)を付与する必要がある。特 に,あるシーンを見つけたい場合には,映像の時間軸に沿った意味内容を記述するメタ データが必要である。現在,このメタデータを付与する作業は人手に頼らざるを得ない 状況であるが,当所では,メディア解析技術を組み合せて,このようなメタデータをで きるだけ効率的に生成するための環境として,メタデータ制作フレームワーク(MPF: Metadata Production Framework)を提案している。本稿では,メタデータ制作フ レームワークの概要を紹介する。

報 告

  • 逐次的な判定手続きに基づくショット境界の高速検出手法
    河合吉彦 / 住吉英樹 / 八木伸行
    PDF ↓概要

    概要
    映像からカメラの切り替え点を検出するショット境界検出は連続的なデータである映像を小さな 構成単位(ショット)に分割する技術であり,映像解析における最も基本的な処理の1つであ る。本稿では,従来手法と同程度の検出精度を維持したまま,より高速にショット境界を検出す る手法として,ショット境界の可能性が低いフレームに対しては処理を省略し,可能性の高い部 分についてだけさまざまな特徴量を逐次的に算出する手法を提案する。実際の放送映像に対する 実験では,再現率が90.4%,適合率が92.8%という良好な結果が得られた。また,約425分のテ ストデータに対する処理時間は208秒(MPEG-1のデコード時間を除く)であり,実時間の約 1/123という高速な処理を実現した。る。
  • 投球の次ショットに重きを置いたシーンのシンボル列化による野球放送映像プレー種分類
    望月貴裕 / 藤井真人 / 八木伸行 / 篠田浩一 
    PDF ↓概要

    概要
    野球放送の映像シーンを数種類のプレー種(本塁打,シングルヒット,四球など)へ自動的に分 くけい類する手法について述べる。提案手法は,画像の特徴や動きの情報を持つ矩形集合を用いて映像 区間を簡略化して表現する技術に基づいている。簡略化処理の基本単位はショットである。更 に,各シーンの投球ショットの次ショットは,プレー種を区別するための重要な情報を含む映像 区間なので,ショットを固定長で分割した部分ショットを簡略化の処理単位とする。学習用の野 球映像シーンを,各ショットおよび部分ショットを簡略化したシンボル列で表現し,プレー種ご との離散隠れマルコフモデル(離散HMM)でそれらのシンボル列を学習する。学習済みのHMM ゆうどを用いた尤度計算を行い,プレー種が未知のシーンにプレー種を割り当てる。本稿では,更に, MLB(Major League Baseball)放送の映像を用いた実験を行い,高精度でシーンを分類できる ことを示す。
  • 電子番組表における紹介テキストを利用した番組紹介映像の自動生成
    河合吉彦 / 住吉英樹 / 八木伸行
    PDF ↓概要

    概要
    映像要約とは元の映像からより短い映像を生成する操作と定義される。映像要約は大量の映像 アーカイブを効率的に検索するための有効な技術の1つである。本稿では,要約映像の1種であ る番組紹介映像の自動生成手法を提案する。番組紹介映像の目的は番組の内容を紹介することで あり,電子番組表に記載されている番組紹介テキストの目的と同じである。提案手法では,番組 紹介テキストの各文に最も類似しているクローズドキャプションを探索し,そのクローズドキャ プションに対応する映像区間を抽出して連結する。番組紹介テキストとクローズドキャプション の類似度の算出には,ベイズ信頼度ネットワークを利用する。実際の放送映像に提案手法を適用 し,複数の専門家が作成した正解データと映像内容を比較した結果,番組紹介テキストを利用し ないでクローズドキャプションだけを利用する従来手法よりも良好な結果が得られた。
  • 蓄積されたニュース番組からの画像付きクイズ生成手法
    佐野雅規 / 八木伸行 / 片山紀生 /  佐藤真一
    PDF ↓概要

    概要
    当所では,さまざまなコンテンツの開発や制作手法の研究開発を行っている。本稿では,コンテ ンツ制作技術の1つとして,ニュース番組からクイズを生成する手法を提案する。まず,クイズ の多くのタイプから画像付き選択クイズを生成することに対象を絞り,問題の定式化を行う。具 体的には,クイズに適した画像の選択,画像を説明している文の選択,似て非なる関係にある選 択肢の生成の3つのサブタスクに分解し,各タスクに対する工学的アプローチを提案する。実験 では,3つのタスクに対するそれぞれの評価と,それらを使って実現したクイズ生成という観点 からの評価を行い,考察する。更に,実験結果を基に,今後,クイズ生成の精度を高めるために は何が必要な要素技術であるのかについて述べる。

研究所の動き

  • 情報還流システム放送を通じた「巨大お茶の間」の形成 PDF ↓概要

    概要
    テレビはお茶の間の主役として家族団らんには欠かせないものであり,テレビ番組に関する話題が日常の会話のきっかけになることも多い。しかし,最近ではテレビを見ながらテレビ番組の感想やコメントをインターネットで送受信する人が若い世代を中心に増えている。そこで,当所では,放送局と視聴者や視聴者同士に新しいコミュニケーションの輪を広げることを目的として,インターネット空間の中に仮想的な「巨大お茶の間」を作ることのできる情報還流システムを提案している(1図)。情報還流システムは,視聴者同士でコメントを共有するだけでなく,字幕放送や放送局にある出演者などの情報を使って,どのシーンのどの出演者に対するコメントかを解析し,視聴者の方にさまざまなサービスを提供することを特徴としている。提供するサービスの例として,集まったコメントの傾向をグラフ化し,その盛り上がりを基にした漫画風のダイジェストサービスや,コメント内容から抽出した興味度に合った番組お勧めサービス,コメント内容の似ている視聴者のブログを相互推薦するサービスなどを開発した。

発明と考案

  • 映像イベント判別装置およびそのプログラム,ならびに,映像イベント判別用学習データ生成装置およびそのプログラム PDF ↓概要

    概要
    特徴と利用分野 本発明は,あらかじめ蓄積および学習しておいたシーンの映像特徴系列とそのシーン内で起こるイベントとの対応データを用いて,新しく入力された映像の各シーンで発生するイベントを自動的に判別する技術である。シーンの映像特徴系列を数値列に変換して処理するので,映像特徴量に加される時間的あるいは空間的なノイズの影響を受けにくく,学習データの量と学習処理時間を削減することが可能である。カメラワークやスイッチンによる映像の推移とイベント内容との相関が強いスポーツ放送映像(野球や体操競技など)へイベント情報を自動的に付与することなどができる。
  • 映像抽出装置および映像抽出プログラム PDF ↓概要

    概要
    特徴と利用分野 本発明は,映像内容を説明するテキスト情報に基づいて,対応する映像区間を抽出する映像抽出装置に関する技術である。電子番組表などから入手した番組紹介文と,番組音声の書き起こしであるクローズドキャプション(CC)あるいは音声認識結果とを対応付けることで,番組紹介文に対応する映像区間を抽出する。本発明により,元の映像から番組内容を短く紹介するための番組スポット映像を自動生成することが可能となる。

論 文

  • 論文紹介 PDF

  • 学会発表論文一覧 PDF

  • 研究会・年次大会等発表一覧 PDF