フェンシングの剣先表示システム(ソードトレーサー)

高橋 正樹 横澤 真介 三ッ峰 秀樹

2020年を見据えて,スポーツ競技の分析や理解に対するニーズが高まっている。中でもフェンシングは,剣が高速で移動するため,スロー映像でもプレーの詳細を理解することが困難な競技である。そこで,赤外映像中から剣先領域を自動追跡し,その移動軌跡をCG(Computer Graphics)でリアルタイムに描画するシステム(ソードトレーサー)を開発した。赤外画像と可視画像を同じ光軸で撮影可能なカメラを開発し,赤外画像上の剣先領域を機械学習により追跡して軌跡を描画した。2017年全日本フェンシング選手権大会において,本システムを初めて運用し,放送に使用した。本稿では,本システムの概要,評価実験の結果,および中継での実運用の結果について報告する。

1.はじめに

2020年を見据えてスポーツ競技への関心が高まっており,これに伴いスポーツ映像の分析を目的とした映像解析技術に注目が集まっている。中でもフェンシングは,選手が細い剣を高速に操るため,その勝敗をカメラ映像から理解することが困難であり,視認性を高める新たな映像表現が求められている。そこで,フェンシングの剣先軌跡を分かりやすく可視化するシステム(ソードトレーサー)を開発した1)

このシステムは,赤外映像上で剣先からの赤外反射光を検出し,その位置座標を基に軌跡CGを描画して,放送カメラ映像へリアルタイムに合成する。当所では,NHK放送技術局と連携して赤外・可視一体型カメラを開発し,カメラ1台による軌跡合成映像の制作を可能とした。また,オブジェクト追跡技術を用いて,赤外反射光の高精度な検出を可能とした。具体的には,機械学習を用いて剣先以外のノイズ領域の影響を抑えながら,予測アルゴリズムを用いて各々の選手の剣先を頑健に追跡した。

2017年全日本フェンシング選手権大会において本システムを初めて運用し,軌跡合成映像を放送に使用した。さらに「スポーツイノベーション」や「超人たちのパラリンピック」などの収録番組においても,剣先軌道を可視化し,選手の技術や戦術を分かりやすく解説した。

2.従来手法と課題

フェンシングの剣は細く,また高速移動時にはモーションブラー(動きのぼやけ)が生じて背景の画像領域に溶け込むため,カメラ画像から視認できないことが多い。このことは,映像解析においても同様で, 通常の放送映像からの剣先検出は非常に困難な課題である。このような可視カメラ映像からの計測困難なオブジェクト(対象物)の位置計測には,光学式モーションキャプチャーシステムが用いられることが多い。このシステムでは,反射マーカーを身体や追跡対象に貼り,複数の赤外線カメラから照射した赤外線の反射光を赤外画像上で検出し,三角測量の原理を用いて各マーカーの3次元位置を計測する2)。外乱となる他の赤外照明や,計測対象以外の反射素材がない撮影環境では,赤外画像の背景が平坦となるため,可視画像よりも高い精度でマーカーを検出することが可能である。ただし,安定運用には多数の赤外線カメラが必要になるため,スポーツの公式試合での運用は難しい。

剣先は細く,また高速移動するため,赤外映像からの剣先検出にも課題が生じる。赤外映像には,剣先からの反射光以外にも,選手のユニフォームや剣のガード部分(手を保護するための金属製のつば)からの反射光が含まれる。これらのノイズ領域の影響を抑えながら,剣先のみを高精度に検出する必要がある。また,フェンシングは2人で行われるため,2つの剣先領域を区別しながら追跡する必要がある。さらに,プレー直後に剣先軌跡を表示するためには,上記のすべてをリアルタイムで処理する必要がある。

映像から特定のオブジェクトを追跡する技術は古くから研究されており,近年では機械学習を用いた高精度な追跡手法が提案されている3)4)5)6)7)。この手法は,追跡対象の画像特徴を事前に学習しておく事前学習型追跡手法と,フレームごとに学習し直す逐次学習型追跡手法に分けられる。逐次学習型追跡手法は,頑健な追跡処理が可能な反面,識別器の更新に多くの処理時間が必要となる。一方,事前学習型追跡手法は,識別器の更新が不要なため高速処理が可能であり,リアルタイム処理が求められる生中継での追跡処理に適している。本提案では,生中継での利用を考慮し,事前学習型追跡手法とともにパーティクルフィルター(後述)による位置予測処理を適用し,高速かつ頑健な剣先追跡処理を実現した。

3.提案システム

3.1 システムの概要

本システムの系統図を1図に示す。まず,選手の剣先の2cm程度の範囲に再帰性反射素材のテープを貼る。再帰性反射素材は,光源から入射した光線を光源方向に強く反射する光学特性を持つ材料である。フルーレ種目*1 では,剣先の15cm以上をテープなどで絶縁する必要があるため,反射テープの使用はルールに抵触しない。

続いて赤外・可視一体型カメラから赤外線投光器で赤外線を照射し,剣先の反射テープからの反射光を赤外カメラで撮影する。そして,赤外画像上で両選手のそれぞれの剣先反射光を検出・追跡し,取得した剣先位置に基づいて軌跡CGを描画する。最後に,CG画像を可視画像へ映像合成器(インサーター)により合成し,軌跡合成映像として出力する。

本システムでは撮影から追跡処理,CG描画,出力までをリアルタイムで処理するため,生中継にも利用できる。

1図 本システムの系統図

3.2 赤外・可視一体型カメラ

赤外・可視一体型カメラの外観とブロック図を2図に示す。本システムで扱う赤外光(IR:Infrared)は,中心波長850nmの近赤外域の光である。放送用レンズから入射した光は分光プリズムを通して赤外光と可視光に分かれ,赤外カメラと可視光カメラ(放送用)へそれぞれ入射する。この光学的構造により,画角の等しい赤外画像と可視画像を取得できる。これにより,軌跡CGを描画する際の座標変換は不要となり,赤外画像上で検出した剣先位置に軌跡CGを描画し,可視画像へそのまま合成できる。一般的な他の光学式モーションキャプチャーシステム2) とは異なり,1台のカメラで軌跡合成映像を作成できるため,運用性に優れている。事前のカメラキャリブレーション作業も不要であり,運用時にはカメラを自由に操作(パン,チルト,ズーム)できる。

2図 赤外・可視一体型カメラ

3.3 剣先検出・追跡処理

赤外画像には,選手のユニフォームや剣のガード部分など,剣先の反射テープからの光以外にも多くの反射光が含まれる。これらが安定した追跡を阻害する要因となるため,機械学習を用いて剣先検出の高精度化を図った。

剣先検出・追跡処理の概要を3図に示す。3図の処理は,学習フェーズと運用フェーズから成る。本システムにおける機械学習は,前述の事前学習型に分類される。

学習フェーズにおいては,剣先と非剣先の画像を1,000枚程度収集し,各画像からローカルバイナリーパターン8)*2 等の低次元画像特徴を抽出した。これらの画像特徴を入力とし,サポートベクターマシン(Support Vector Machine:SVM)9)*3により,剣先/非剣先の識別器を作成した。

運用フェーズにおいては,赤外画像中から剣先の候補領域を抽出し,各領域が剣先か否かを2クラス判定*4 した。この処理により,ノイズ領域の誤検出を軽減した。また低次元(64次元)の画像特徴を用いたことにより,放送カメラのフレームレート(59.94コマ/秒)での識別が可能となった。

また,フェンシングは2人で行われるため,複数の反射光を追跡する必要がある。そこで2つの探索範囲を用意し,それぞれの探索範囲内で剣先を探索した。探索範囲の位置,サイズ,形の決定には,予測アルゴリズムの一種であるパーティクルフィルター10)*5 を用いた。そして,剣先の検出位置と各パーティクルが予測した位置との距離から尤度を算出し,パーティクル尤度*6 の重み付き平均で次フレームの予測位置を定めた。また,パーティクルの分布に応じて探索範囲の大きさや形状を随時変更し,2つの剣先を頑健に識別した。この探索範囲の利用により,処理の高速化と追跡精度向上の双方を実現でき,生中継での運用が可能となった。

3図 剣先検出・追跡処理

4.実験

開発したシステムの性能を評価するために,フェンシング映像(10シーケンス)を用いた実験を行った。各シーケンスで,剣先の検出位置と手動アノテーション*7 による正解データとの平均誤差(pixel),およびフレームごとの平均処理時間(msec/frame)を算出した。また,従来手法として2種類の逐次学習型追跡手法(MIL, KCF)を用意し,それらとの性能を比較した。

MIL(Multiple Instance Learning)は追跡対象の周辺領域から正例,外側領域から負例を抽出しながら識別器を毎フレーム更新する手法であり11),学習データの誤りにも頑健に対応できるという特徴を有する。一方,KCF(Kernelized Correlation Filter)は,巡回行列*8 を用いて処理速度を飛躍的に高めた逐次学習型追跡手法であり, 最先端の追跡手法の1つとされている12)

評価結果を1表に示す。平均誤差,処理速度ともに,提案手法が最も良い結果が得られた。フェンシングの剣先は動きが速く,毎フレーム識別器を更新する逐次型追跡手法では安定した追跡が困難であった。また,一度追跡に失敗すると,更新後の識別器による再検出が難しく,検出誤差が広がる傾向があった。これに対して,事前学習型追跡手法を用いた本システムは,識別器の更新が不要であるため高速に動作し,剣先の速い動きにも対応できた。また追跡に失敗した際も,パーティクルの分布に応じて探索範囲を拡大することで,頑健に再追跡することができた。以上の結果より,本システムがフェンシング中継において有効に機能することを確認できた。

1表 追跡性能の比較
MIL11) KCF12) 提案手法
平均誤差(pixel) 127.6 42.0 5.7
処理速度(msec/frame) 54.6 11.2 2.8

5.中継での実運用

本システムを2017年12月の第70回全日本フェンシング選手権大会において初めて運用した。競技場から25m離れた2階の観客席に赤外・可視一体型カメラを設置し(4図(a)),試合を撮影した。撮影した可視映像と赤外映像を操作ブース(4図(b))へ送り,PC(パソコン)で剣先の反射光を追跡しながら軌跡CGを描画し,元の可視映像へリアルタイムで合成した。さらに,作成した軌跡合成映像を中継車へ伝送し,収録機で常時収録した。

試合中,得点シーンなどの特徴的なプレーの直後に,収録した軌跡合成映像をスロー再生した。公式試合での剣先軌跡表示は, 今回が初の試みであり, 視聴者からは「軌跡表示によって試合内容が分かりやすくなった」という好評を得た。また「スポーツイノベーション」や「超人たちのパラリンピック」などの収録番組でも軌跡合成映像を利用し,剣先の動きに現れる選手同士の駆け引きを,軌跡を基に詳細に解説した。

また,2018年5月のNHK技研公開では,フェンシングの実演を基に,剣先軌跡映像を作成した。その例を5図に示す。

4図 第70回全日本フェンシング選手権大会におけるシステムの外観
5図 剣先軌跡の合成映像例 ( 2018年のNHK技研公開)

6.まとめ

フェンシングの剣先軌跡をリアルタイムで可視化する装置(ソードトレーサー)を開発した。赤外画像と可視画像を同じ光軸で撮影可能なカメラを独自に開発し,赤外画像から機械学習を用いて剣先の反射光を追跡した。第70回全日本フェンシング選手権で初めて運用し,公式試合での選手の剣先軌跡を可視化した。さらに収録番組でも競技解説に利用し,活用の幅を広げた。

今後は,追跡性能の更なる改善を図るとともに,他競技への応用を視野に入れた改修を行う予定である。

本稿は,ACM SIGGRAPH Proceedingsに掲載された以下の論文を元に加筆・修正したものである。
M. Takahashi, S. Yokozawa, H. Mitsumine, T. Itsuki, M. Naoe and S. Funaki:“Sword Tracer: Visualization of Sword Trajectories in Fencing,” Proc. ACM SIGGRAPH 2018, doi: 10.1145/3214745.3214770, 2018.