aiの最新記事

Image credit:

Google、ニューラルネットワークで写真の場所を特定する「PlaNet」を開発。人間を超える能力を発揮

Munenori Taniguchi
2016年3月1日, 午後04:40 in Ai
1140 シェア
338
421
84
33
264

注目記事

人気記事

Googleが、人工ニューラルネットワークを利用した画像撮影場所特定技術を開発しています。PlaNetと名付けられたこのシステムは、写真に写り込んでいるものから、それが地球上のどこで撮影されたものかを特定することができます。

人間も、写真からその撮影された場所を特定することに長けてはいます。それは実際にその場所へ旅行したりテレビや雑書・書籍などの写真からある程度は世界各地の植物や建物、山、海といった風景の情報を記憶しているから。

この記憶するという能力について、人間をはるかに上回っているのがコンピューターです。しかもコンピューターはインターネットで世界中とつながっており、SNSにはあらゆる写真がアップロードされています。アップロードされているデジタル画像にはGPSのジオタグ情報が記録されているものがあるほか、Googleストリートビューに写り込んでいる風景もその特色と地理的情報と結びつけるうえで有効に活用できそうです。

Googleのチームは、こうした写真と撮影場所を記した約1億2600万枚もの画像データベースを構築。それをPlaNet と名付けた人工ニューラルネットワークに入力し、写真と撮影場所の関連性を教え込みました。
 

動作を確認するため、チームはFlickrで公開されている270万枚の画像を使い、ジオタグを除いたうえで写っている場所を特定するテストを実施しました。まず写真が写している道路(通り)の名前を特定する実験では、正答率はわずか3.6%にとどまりました。これが都市名をあてるルールにすると10.1%に、国を特定するのであれば28.4%にまで増加しました。ちなみに大陸レベルでの正答率は48%。

数字だけを見ると、その程度かと思ってしまうところですが、マサチューセッツ工科大学の技術誌 MIT テクノロジー・レビューによれば、これはもの凄い数字なのだとか。

開発チームはさらに人間の記憶力と PlaNet を比較するため Google ストリートビューからランダムに選んだ風景から、その場所を答えるゲームのサイト「GeoGuessr」を使った試験を実施しました。世界各国を旅した経験を持つ10人の被験者に PlaNet と勝負してもらったところ、PlaNet が人間に対して28勝22敗で勝ち越す結果となりました。
また開発チームによれば、写真の撮られた場所と回答場所の距離的な誤差は PlaNet が平均1131.7km、人間は平均 2320.75km となり、精度の面でも PlaNet のほうが優れていることがわかったとのこと。

数字の大小だけを比較すれば、とりあえずすべてのテストで PlaNet が人間に勝っており、素晴らしい能力といえるのかもしれません。開発チームは正答率をさらに上げるべく研究を続けるとのことなので、今後に期待したいところです。

なお、GeoGuessr は誰でも自由にプレイできます。筆者がアクセスしてみたところ、だだっ広い草原にひたすら続く一本道、傍らには送電用の鉄塔、という写真が現れました。ここが一体どこなのか全くわからないものの、右下に表示される世界地図の右下の大陸が「オーストララシア」になっているのが気になってしかたがありません。

1140 シェア
338
421
84
33
264