AIを使ってサルの社会を大規模に見る
香田 松田と一緒にやった研究でもう一つ紹介したいのが、国立研究開発法人科学技術振興機構(JST)が実施したCREST(Core Research for Evolutional Science and Technology)という大きなプロジェクトの一環として行った「脳領域/個体/集団間のインタラクション創発原理の解明と適用」です。ここは今日のメインテーマになっているAIとも関わってくるところです。
松田 僕は2016年から中部大学の創発学術院で勤務することになりました。そこの院長だった数理学者の津田一郎さん(北海道大学名誉教授、中部大学名誉教授)が立ち上げたのが、「インタラクションの創発原理」という取り組みです。聞き慣れない言葉だと思いますが、いろいろな物事が相互に作用して新しい生命現象が生まれるときの原理を探るといったイメージですね。津田さんが「霊長類の社会進化を調べよう」と提案され、僕がその班のリーダーに抜擢されて、「一緒にやらないか」と香田を誘いました。
香田 このときの僕らのターゲットは、「サルの社会はどのように生まれるのか」でした。例えば、テングザルは一頭のオスが強くてメスがそれに従うという基本的な構造があって、それを一つの最小の群れ単位として、そういった群れが複数集まることで、一つの地域集団を形成しています。テングザルの社会はそうしたイメージでできています。
同じような社会構造を持っている生き物で、一番想像しやすいのはヒトです。ヒトは家族で生活して(いろいろなケースがありますが)、会社や大学に在籍していたり、日本という国家の一員であったりして重層的な関係を持ちながら社会という複雑なネットワークをつくっています。津田さんは、その状況を数理的に表現して、その創発の原理を調べようという壮大なプロジェクトを立ち上げたわけです。
僕らがまず取り組んだのが、AIを持ち込んで大規模にサルの社会を見てやろうという試みでした。ちょうど深層学習(ディープラーニング)を用いた研究が進展した頃ですから、僕らも仲間に手伝ってもらいながらやってみたわけです。
松田 新型コロナの影響もあっただろうね。現実問題としてフィールドワークに行けなくなったので、新しいタイプの研究に手を出してみようというところはあったよね。コロナがなかったらやらなかったかもしれない。
それで霊長類研究所のニホンザルを使って、何かできることはないかと考えた。このときに使ったのがビーコン(Beacon)というBluetoothの小型のタグでした。これをサルに付けて、まずは位置情報を集めてみた。普段フィールドワークで使っているGPSテレメトリは1時間に1点くらいの精度ですが、ビーコンは1秒間に7点ぐらいの位置情報が取れるのでGPSよりもはるかに高精度で誤差も少ない。元々は製造会社が工場内における人の流れを測ることをコンセプトに開発された新しい技術です。
ケージ内にいる一つ群れのすべてのニホンザルにこのタグを付けて、群れにおける各個体の位置情報を追跡しました。1秒間に7点ですから1時間計測しただけでも膨大なデータが集まります。それを1カ月分ですから、途方もない量になった。
香田 技術的に可能なのであれば、まずはサルたちのすべての動きを記録してやろうと考えたわけだけど、扱い切れないほどのデータが集まった。
松田 フィールドで調査している僕からすれば、あまりに膨大なデータ量、未知の世界で最初は何をどう見ればいいのかわからないというのが正直なところでした。
香田 手始めにやったのは、サルの動きのデータを解析することで、深層学習は各個体を区別できるのかという試みです。まずはA、B、C、D、Eという5頭の約100万の移動点データを深層学習に学習させます。次に、そのうちの1頭のサルの5分間分の移動点を記録したデータを提示します。そして「これは誰ですか?」と聞くと、大体4割から5割の精度で正解を答えました。つまりわずか5分間であってもサルの動きには個性が現れて、深層学習は「これはあのサルだ」と特定できるという意味になります。
けれども、冷静に考えるとこれは本当にすごいことなんですかね? とも思うわけです。当てずっぽうで答えても5分の1の確率ですから、4割から5割だと結構間違っているとも言える。だから「偶然よりはわかる」という程度の正解率なんですよ。我々のようにサルを見ることに慣れた人であれば、5分間見れば「ああ、あいつだ」ってすぐにわかります。
松田 膨大なデータとグラフを使って学習させたけど、果たして「これはすごいことなのか?」と聞かれれば、大いに疑問だよね(笑)。
香田 それから1頭でいるときと5頭でいるときとでは、サルたちの動き方に違いが出るのかを調べました。まずは膨大な移動データを深層学習に学習させます。次に新しいデータを読ませて、「サルは1頭でいるのか、5頭でいるのか」と聞くと、かなり高い精度で正解を答えました。つまり、サルは他のサルがいることで、移動のパターンを変えていると言えます。でも「まぁ、それはそうだろうな」と思うじゃないですか(笑)。確かに実際に区別できているわけだけど……。
松田 「だから何なの?」と聞かれると、その先の意義を見出すことはむずかしい。
AIだからこそ気付かされたこともある
香田 最後にもう一つ例を紹介すると、あるサルの動きは他の誰かの動きにつられていることをデータとして集積して、その関係性(ネットワーク)を可視化する試みもやりました。人間の社会では、誰かが動くことによって他の誰かが動くことになるという相互作用の関係が常にあります。今の「対話」の収録に喩えると、僕は松田の発言に対して必ずフォローしています。この状態は、僕は松田の動きに対して依存度がすごく高くなっているとみなせます。収録している編集部の皆さんは、僕らが話しているあいだは黙ってそれを聞いています。黙っているわけだから、ある意味では僕らの発言に対して依存度が高い状態だとも言えます。
サルの社会でも似たことが起きているので、そこにどのような依存関係があるのか探りたいと考えました。まずは、「このサルは他のどのサルに依存して動いているのか?」といった関係性を示す100万パターンぐらいのデータを機械学習に学習させます。サルの社会の関係性を抽出するために用いたトランスフォーマーというAI技術は、実は今のChatGPTの基盤になっている言語モデルの基盤と似ています。
言語モデルは、ある単語の次にくる単語では何が一番自然なのかを予測して生成する仕組みです。ChatGPTは単語間の依存関係が学習されていて、次に来る言葉を推定して考えています。僕らはそれを「単語」ではなくサルの「個体」を一つの単位として捉えました。単語と単語ではなくサルとサルに置き換えたわけですが、ロジックはよく似ています。この仕組みを使って、サルたちの社会がどのような依存関係になっているのかに注目したわけです。
この相互作用の研究の結果は、とても素朴なものでした。オス同士あるいはメス同士の結びつきが強いとか、強い個体が来ると弱い個体は離れるといった結論が出ました。僕ら霊長類学者からすれば、百も承知のことです。
松田 AIに教えてもらわなくても知っているよという話だね(笑)。
香田 先端的な手法ですからやっていて楽しかったのですが、出てきた結果は先人がやったことをなぞっている感がすごく強かった。この研究をやり続ける意義があるのだろうかと疑問に感じてしまったのが、正直なところです。お金も掛かりますからね。
最初に僕らが想像していたのは、サルの社会の変化を捉えることでした。例えば、9頭の群れがいたとしたら、その中にどうしても一番強い個体が出てきます。その存在がいなくなると、社会がどのように壊れていくのか見たかったんです。あるいは、最上位のサルを神経科学的な手法で性格を変える処置をした場合、それによって他のサルの動きがどのように変わって、サルの社会にどんな影響が出るのかを検証しようともイメージしていました。
松田 残念ながら、そこまで到達する前にプロジェクトの期限が終わってしまいました。
香田 ただ一連の研究を実施したことで見えてきた発見もありました。僕らがサルの社会関係を測るときに伝統的にやってきたのは、グルーミング(毛づくろい行動)や近くにいるかどうかといったポイントでの評価でした。仲がいいから近くにいる、あるいは毛づくろいを一緒にやってれば仲がいい。だから結びつきが強いというふうに考える。
逆に言えば、毛づくろいをやっていない者同士は疎遠だと見るのが素直な考え方ですよね。誰かがいることによって避けるのは、それは反発だから社会としてはすごく強い依存です。そこをはっきりとデータで表現できたことは、ちょっと新しかったかなと思います。
人間側の視点で見ると、仲がいい者同士の依存関係が強く印象に残るのだけど、避け合う者同士も依存度は強いことがデータとして浮かび上がってきた。こうした関係性を数字ベースで客観的に指摘してくれるのは、AIらしさだと思います。
松田 先入観があるから、そこは見落としがちかもしれない。いっぱい毛づくろいするとか、すごく攻撃されるといった直接的なコミュニケーションは強く印象付けられるからね。けれどもAIは、逆にそうした結び付きが「ない」という特徴を気付かせるところがある。そのデータを見たときは確かにハッとさせられた。ここは盲点だったね。
香田 観察者が解釈していくやり方と、数字ベースで客観的に表現していく機械学習のアプローチとでは、そういうところに違いが出てきます。科学は客観性と再現性を重視するから、対象を数字で表現していくことでいろいろな根拠が出てくるのは有用だろうと思います。
ドローンとセンサーをつかって森の健全度を見極める
香田 CRESTでの挑戦は期待したほどの成果を上げられませんでしたが、それでも新しい技術は我々の研究のあり方を根本的に変える可能性が多いにあります。そういう形で自由に色々な研究に挑戦させてくれた津田さんたちにはとても感謝しています。次に、この将来の可能性あたりについて少し考えてみます。いま松田は、ボルネオのフィールドでAIや最新のテクノロジーを使ってどのような挑戦をしているのか教えてもらえますか?
松田 新しいと言えば、ドローンとセンサーを使った動植物の調査ですかね。熱帯の森にとって、大型の動物の存在はとても大事です。なぜかと言えば、大きな果物を摂取し、その種子を排泄・散布してくれるからです。仮に森から大型の動物がいなくなると、大きな種子を付ける植物の種子は散布されず、世代更新ができなくなってしまう。
けれども大型の動物は棲息地の破壊や狩猟などによって減少し続けていて、常に絶滅の危機に瀕しています。大型動物がいなくなった森は、一見問題がないように見えたとしても健全ではない状態です。こうした森を「空洞化した森」と呼んでいます。空洞化した森では、大きな種子を付けるような植物が更新できず、植物の多様性がどんどん低下してしまう。今こうした森が増え続けているので、いち早くそれを検知しようというわけです。
香田 最先端のセンサーを搭載したドローンを飛ばしているイメージ?
松田 30から40メーターぐらいの上空から熱赤外センサーを搭載したカメラで森を計測することで、大型の動物の棲息密度や出没する地点を広域に定量的に把握しようと計画している。
香田 いわゆるサーマルイメージングだ。上空からでも恒温動物が持っている熱源を計測できるから、そこにサルが存在していることがわかるわけだ。どのぐらいの精度で出るの?
松田 新しく購入した最先端のセンサーであれば、群れで動いているサルならすぐにわかるし、オランウータンのような大きなサルなら1頭単位でわかると思う。
香田 本当に? 個体識別まで可能なの?
松田 個体まで識別できるかどうかはわからないけど、これがテングザルなのかオランウータンなのか、あるいはカニクイザルなのかまでは判別できると思う。
香田 オス・メスも区別できる?
松田 テングザルやオランウータンのオスはでかいからわかるかな。
香田 それはすごいね。どれぐらいの範囲で操作できるの?
松田 ドローンのバッテリーの問題があるから、30分で飛べる範囲が限界になる。いま考えているのは、川に沿って上流まで10キロ飛んで戻ってくるようなプログラムを事前に組んでおいて飛ばそうかと。
香田 それは今までに識別した群れに対して調査する感じ?
松田 いや、すでに識別した場所以外のエリアまで拡げて把握したいと計画していて、理想的には川沿い200キロくらいの広いエリアをすべて評価したい。それからLiDAR──レーザー光を照射して対象物までの距離や形状をセンチメートル単位の高精度で測定する3Dスキャンセンサー──のような装置を使って、植生データも取ろうと計画している。
香田 レーザー光を飛ばして、対象エリアの立体的な形状をすべて取ってくる手法ですね。
松田 こうした新しい技術を駆使して定量的なデータを集めることで、その森が健全なのかそうではないのかを見極めたいわけです。一見すると「草木が生い茂っているから大丈夫だ」と思える森でも、実際はすでに危険領域に入っていて空洞化の一歩手前だったりする例はたくさんあります。その兆しが出ているのであれば、現地の政府などに状況を伝えることで、その森を重点的に保護するといった活動につながることが期待できる。
生物多様性をどう評価するのかといったテーマにおいても、新しい技術は有効だと考えています。今は大型動物だけを対象に調査を行っていますが、それだけではなく「音トラップ」といって虫や動物たちの鳴き声を録音することで、森の多様性を評価する方法も可能でしょう。これまでも自動撮影カメラや環境DNAなどの手法が用いられてきましたが、それらを組み合わせてベストな手法を探るプロジェクトを始めています。
ただ、ドローンを飛ばすための申請に時間がかかりすぎたり時期的な問題もあって、苦戦もしているのが現状です。
