炭化した巻物の解読からナスカの地上絵発見、AIで加速した科学的発見の数々
(CNN) 焦げてもろくなった何百もの古代の巻物は、広げようとすると崩れてしまい、文字の痕跡は判読できないに等しい。「ヘルクラネウムの巻物」は今も開封されていないが、人工知能(AI)という強力なツールのおかげで、その内容を理解できるようになった。
3人の研究者は2023年、AIと高解像度のX線を使用して、巻かれた状態の巻物から2000文字以上を解読した。この驚くべき偉業により、西暦79年のベスビオ火山噴火で消失を免れたパピルスの冒頭の一節すべてが明らかになった。
ユリウス・カエサルの義父の自宅から回収されたと考えられているこの文書は、古代のローマとギリシャに関する新たな情報の宝庫となっている。
解読コンペ「ベスビオ火山チャレンジ」を立ち上げたコンピューター科学者らは、この年末までに4巻の90%が解読されることを期待している。解読にあたっての主な課題は、文書を仮想的に平らにし、黒インクと炭化したパピルスを区別してギリシャ語とラテン語の文字を判読可能にすることだった。
巻物の新たにスキャンされた部分からはギリシャ語のテキストが判読できる/Vesuvius Challenge
AIは科学的発見の状況を一変させた。AIツールを使用した査読付き論文の数は15年以降急増し、AI手法を使用した論文は引用数が増える可能性が高くなっている。ネイチャー誌の調査によると、1600人の科学者の半数以上がAIツールについて研究業務に「非常に重要」または「不可欠」だとしている。一方で、世界最古の科学アカデミーである英国王立協会は、多くのAIツールのブラックボックス性がAIベースの研究の再現性を制限していると警鐘を鳴らす。
ベスビオ火山チャレンジは、急速に進化するAI分野が科学を揺るがし、24年に予期せぬ事実を明らかにしたほんの一例にすぎない。AIはまた、深海で動物がどのようにコミュニケーションをとるかについての科学者の理解を促し、考古学者が人里離れた荒涼とした地形で新たな遺跡を発見するのを助け、生物学の難問を解決している。
クジラの言語の解読
マッコウクジラが発する謎めいたクリック音にさまざまなテンポやリズム、長さがあることは分かっているものの、球根状の頭部にある器官から発せられるこれらの音で何を言っているのかは人間の耳では理解できない。
一方で機械学習は、科学者らがコーダと呼ばれるクリックシーケンスを分析するのに役立っている。科学者はカリブ海に生息する約60頭のマッコウクジラから9000件ほどのコーダを録音した。この研究により、人間はいつの日かマッコウクジラとコミュニケーションをとれるようになるかもしれない。
科学者たちはクジラの単独発声、合唱、クジラ同士のやり取りにおけるコーダのタイミングと頻度を調査。AIで視覚化すると、これまでに見られなかったコーダのパターンが浮かび上がった。研究者たちはそれを人間のコミュニケーションの音声体系に似ていると評している。
機械学習は、科学者らがコーダと呼ばれるクリックシーケンスを分析するのに役立っている/Reinhard Dirscherl/imageBROKER/Shutterstock
遺跡の発見
一方、陸上では、AIがペルー・ナスカ砂漠に刻まれた地上絵の探索を加速させている。考古学者らはこれらの発見と記録にほぼ1世紀を費やしてきた。
多くの場合、上空からしか見えないこの広大な地上絵には、幾何学模様や人間のような形象、ナイフを持ったシャチなどが描かれている。
山形大学の坂井正人教授(考古学)が率いる研究チームは、20年時点で確認された地上絵430個の高解像度画像を使用して、物体検出AIモデルを訓練した。
22年9月から23年2月にかけて、チームはナスカ砂漠でモデルの精度を検証。徒歩とドローン用いて有望な地点を調査し、最終的に303個の表象的な地上絵を「地上検証」した。わずか数カ月のうちに既知の地上絵の数をほぼ倍にした形だ。
AIベースのモデルは、科学者がペルーのナスカ砂漠に刻まれた謎のシンボルを発見する一助になっている/Yamagata University Institute of Nasca
AIモデルは完璧には程遠かった。629平方キロに及ぶ砂漠地帯から4万7000カ所以上の候補地が提案されたからだ。チームはそれらの提案を精査し、「非常に有望」な候補地1309カ所を特定。有望な候補の割合は、AIモデルが提案した36カ所につき1カ所だったという。
ドイツ・イエナにあるマックス・プランク人類史科学研究所の研究者兼データサイエンティスト、アミナ・ジャンバジャンサン氏はそれでもなお、AIは考古学、特に砂漠などの遠隔地や過酷な地形において大きな貢献を果たす可能性があると指摘した。
生命の構成要素を理解する
AIモデルは、研究者が最小単位で生命を理解する手助けもしている。つまり、生命の構成要素であるタンパク質を形成する分子の鎖だ。
タンパク質はわずか20個ほどのアミノ酸で構成されているが、これらはほぼ無限の方法で組み合わせることができ、3次元空間で非常に複雑なパターンに折り畳まれる。
何十年もの間、これらの3D構造の解読は、細かい実験とX線結晶構造解析と呼ばれる技術を必要とする、困難で時間のかかる作業だった。
しかし、18年に画期的なAIベースのツールが登場した。英ロンドンのAI開発企業グーグル・ディープマインドのデミス・ハサビス氏とジョン・ジャンパー氏が開発した「アルファフォールド・タンパク質構造データベース」の最新版は、アミノ酸配列から既知のタンパク質2億種類のほぼすべての構造を予測する。
既知のすべてのアミノ酸配列と実験的に決定されたタンパク質構造に基づいて訓練されたこのデータベースは、「グーグル検索」として機能する。ボタンを押すだけでタンパク質の予測モデルにアクセスできるため、基礎生物学や医学を含むその他の関連分野の進歩が加速する。このツールは世界中で200万人以上の研究者に活用されている。
ハサビス氏とジャンパー氏は今年のノーベル化学賞を受賞した。