顔データ・認知・災害

顔認証システムを扱う時についてまわるのが顔データです。今回は顔データに関しての扱いの難しさや考えること、話題について徒然とお話しします。後半は災害時に顔認証システムが貢献しうるか書きました。

データセット

完璧でオープンな顔データセットは存在し得るのか。

日本人の男女均等な300万人分の重複のないデータセット。多民族や外国のセレブ限定ならデータセットが存在しますが、日本人のものはありません。民族が異なると今の手法では認識率が落ちてしまいます。

何年か前にIBMが公平性のために顔データセットを公開すると宣言していましたが実際にはすぐに公開されなくなってしまいました。githubでは何人も残念がる声が書かれていました。その場では結局誰もデータをダウンロードできた人はいなかったのだとか。会社の名前は忘れましたが外国のどこだかの超有名な企業がフェイスブックなどから当人の承諾なしに大量の顔画像をデータセットとして使用していることが公になって、これも大問題になっていました。外国のいくつかの政府機関にシステムを納入していたそうなのですが大問題になったその後を知りません。

顔は「変更できないパスワード」とどこかに書いてありました。上手いこと言うなぁ。マイクロソフトはパスワードを補完するものとして顔認証を取り入れるとニュースにあったような気がします。「顔パス」なんて言葉が昔からありますが、確かに顔だけ見て判断してくれるのが一番ラクですよね。顔パスできるのはお得意様の印ですから一種のステータスでもあります。一方では「変更できないパスワードとしての顔」、もう一方では「顔パスしてくれたらいいのにという願望」が同じ世界に存在するんですね。人によってどちらがどのくらい大事か異なるので、全員の顔データを収集して一律に便利にするわけにも行きません。時々考えるのですが超大企業で顔認証システムを販売しているところはデータセットのための顔データをどこから入手するのでしょう。。関連子会社あわせて全ての従業員の顔写真を収集したのでしょうか。了承が得られれば社員の家族の写真も使わせてもらうとか?超大企業なら300万人分の顔写真が収集できるのでしょうか。インターネット企業のように写真サービスの見返りとしてデータを使用するのでしょうか。よく知りません。

誰でもアクセスできるオープンな顔データセットというのは幻想なんでしょう。顔というのはそれだけプライベートな領域も含んでいるということです。

人間と機械の認知能力について

最初に問題です。上の段と下の段のそれぞれ同一人物どうしを線で繋いでください。

同一人物どうしを線で繋いでください

インターネットから著名人の顔データを収集してアイドルの顔認識…というお話をよく聞きます。そのことについて考えると気付くのですが、そもそも著名人でないと個人が識別できません。自分でやってみたら著名人でさえ顔と名前が一致しないケースが多々ありました。


斉藤祥太_3.png(左)と斉藤慶太_2.png(右)

斉藤祥太さんと斉藤慶太さんは双子さんだとのことです。さて困ってしまいました。2枚の写真、FACE01では99.50%の類似度でした。プログラムを組んでインターネットから顔写真を収集した場合、ダウンロードされた顔写真が本当に彼(彼女)であるか確認しなくてはいけません。でも自分には上記の写真が本人様を写したものであるのか、更に言うと祥太さんなのか慶太さんなのか判別がつきません。ファンの方々やご友人・ご家族の方は簡単に判別できる筈なので、人間の認知能力には考えさせられるものがあります。

人間の認知能力といえば、人間が他者を認識する時、顔のパーツ「のみ」で評価しているかといえばそうではありません。声、服装、動作など「その人独特の雰囲気」を感じとった上で評価しています。人間にとっては必ずしも顔パーツの優位性がダントツに高いわけではないのでしょうね。深層学習手法は人間の認知能力を超えている旨のグラフを見ることがありますがあれは顔パーツのみを切り抜いた上で評価させているからであって、機械がその人独特の雰囲気まで評価しているわけではないです。そういう意味では人間の認知能力には機械は敵いません。例えば顔パーツのみを比べると同一人物かどうかよくわからなくなる例が下の図です。

顔パーツのみの比較評価

人間の「雰囲気も利用して個人を見分ける」習性を利用すると、顔パーツは全く異なるのに同一人物に似せることが出来る事が広く知られています。モノマネ芸とかですね。更に発展して顔パーツは同じなのにひとりひとりを別人にみせる芸が存在します。ガリットチュウ福島 (@garifukushima)さんのツイートから画像をお借りします。

『哀愁』

面白いですね!なんと140人分もあるとの事です。凄いです。

実際雰囲気が変わってしまうと別人に見えたりするものです。著名人の名前で検索した時に出てくる顔写真の中には雰囲気が全く違うものが混ざっていて「本当に同一人物?」と思ってしまったりします。では最初の問題の答え合わせをしますね。

たぶんこれであっているはずです。もし間違っていたらコメントにてご連絡ください。

顔認証は顔パーツのみを評価するので雰囲気には騙されません。さて、色々考えると顔認証と人、どちらが他人をうまく見分けられるのか分からなくなってきますね。

大災害時に顔認証システムは貢献できるか?

タイトルそのままです。もし南海大地震のような巨大地震が起こった時、離れ離れになってしまった家族はどのようにお互いの安否をしればよいのでしょうか。調べてみたら色々考えられているようです。その中には顔認証システムを利用したものもありました。とても便利だなと思う反面、顔認証システムにつきものの懸念もあります。

この画像はイメージです

試しにイメージ画像を作成しました。実際にお二人の類似度はFACE01では99.54%でした。左は潮田玲子さん、右は福原愛さんです。

生体認証の中でも顔はあいまいな部類に入ります。可能性は低いですが違う人物の顔写真が提示されてしまう場合も当然考慮すべきです。人間が見て、特にご身内がご家族とは違う顔写真を見れば一目瞭然で「違う」と判断できますし、特に災害時は緊急を要しますからこれは立派に貢献するはずです。反面、違う人物の顔写真を提示してよいのかという懸念も生じます。一度画面に表示させてしまえばどの様な使われ方をされるか分からないのがインターネットの怖い一面ですから、プライバシーに係るものは可能性が低いとしても表示させるべきではないでしょう。

では顔写真を表示させなければいいのではないか?とも思いますが、それでは利便性が一気に悪くなります。個人的にはそれでも良いので災害時には利用されてほしいシステムだと思います。

この画像はイメージです

あと考慮したいのは中央サーバーにするのか分散サーバーにするのかです。大災害の場合中央サーバーだとそこがダウンすればサービス提供自体が不可能になります。とはいえ、生の顔情報を複数拠点と共有するのは好ましくありません。

そこで顔情報を復元不可能な数値データとして共有する方法があります。この場合数値データから元の顔を復元できませんので、たとえ求められたとしても顔画像を表示させることは(開発した技術者にも)出来ません。顔画像を表示できないことで一定の利便性は失われますが、「この顔をした人物がいつどこの避難所にいたか知りたい!」という要求には答えることが出来ます。単なる数値データですのでデータの共有・同期が可能ですし、計算方法さえ共通化させておけば後は無人で動きます。顔画像として復元できないので、避難所に設置したカメラからデータ化しても問題はないはずです(と思います)。

生の顔情報を復元できない数値データへ変換するメリットは送受信する情報量にもあらわれます。大災害が起こった場合、情報の送受信は無線通信に頼らざるを得なくなります。有線と比べて無線は通信速度が遅く大容量通信には向きません。解像度の良い写真5.8MiBと数値データファイル2.6KiBは2,330倍以上の容量差があります。人数が1000人増えただけで容量差は2,230万倍以上にも膨れ上がり、これでは無線通信がパンクしてしまいます。

被災地域は個人確認している余裕はないはずですので、顔認証システム自体は緊急を要する災害時に力を発揮してくれそうです。法的に問題がないか検討したりシステムを構築するための仕組みが必要ですから実現するかどうかは分かりません。あったら素晴らしいと思います。

こういったことは自治体任せではなく民間も協力するべきですね。利益にならないので実現しないでしょうか。東京都のコロナ対策情報提供にオープンソースの仕組みが取り入れられていましたがあれはどういう経緯で発展したのでしょう。とても興味があります。

以上です。今回は思うところを書いてみました。最後までお読み頂きありがとうございました。

コメントを残す

メールアドレスが公開されることはありません。

eleven + four =