アイザカと共に過去を予測する

'Predicting the past with Izaka'

AIと歴史家の協力による古代のテキストの復元、配置、および年代付け

人類の執筆の誕生は、歴史の夜明けを告げるものであり、過去の文明と私たちが今日生きる世界を理解する上で重要です。たとえば、約2,500年前、ギリシャ人は石、陶器、金属に書き込みを始め、賃貸契約や法律、カレンダーや神託など、地中海地域に関する詳細な情報を記録しました。残念ながら、それは不完全な記録です。保存されている多くの碑文は、数世紀にわたって損傷を受けたり、元の位置から移動されたりしています。さらに、放射性炭素年代測定法などの現代の年代測定技術は、これらの材料には使用できないため、碑文の解釈は困難で時間がかかるものとなっています。

DeepMindは、知能を解決して科学と人類を前進させるというミッションに基づいて、ヴェネツィアのカ・フォスカリ大学人文学部、オックスフォード大学クラシックス学部、アテネ経済・ビジネス大学情報学部と共同で、機械学習が歴史家によるこれらの碑文の解釈を支援する方法を探索しました。これにより、古代の歴史のより豊かな理解が得られ、AIと歴史家の協力の可能性が開かれました。

本日Natureに掲載された論文では、私たちは共同でIthacaを紹介しています。これは、損傷した碑文の欠損テキストを復元し、元の位置を特定し、作成された日付を推定することができる最初のディープニューラルネットワークです。Ithacaは、ホメロスのオデュッセイアに登場するギリシャの島にちなんで名付けられ、以前のテキスト復元システムであるPythiaを拡張しました。評価の結果、Ithacaは損傷したテキストの復元において62%の精度、元の位置の特定において71%の精度を達成し、テキストの推定日付を正解の日付範囲から30年以内に特定することができます。歴史家はこのツールを使用して、ギリシャの歴史の重要な時期を再評価しています。

私たちの研究を研究者、教育者、博物館のスタッフなど、幅広い人々に提供するために、Google CloudとGoogle Arts & Cultureと提携してIthacaの無料インタラクティブバージョンを公開しました。さらなる研究を支援するために、私たちはコード、事前学習モデル、および対話型のColaboratoryノートブックもオープンソース化しました。

図1. この復元された碑文(IG I3 4B)は、アテネのアクロポリスに関する布告を記録し、紀元前485/4年のものです。(CC BY-SA 3.0、WikiMedia)
図2. Ithacaのアーキテクチャ。テキストの損傷部分はダッシュ「-」で表されます。ここでは、文字「δημ.」を人工的に破損させました。これらの入力が与えられると、Ithacaはテキストを復元し、テキストが書かれた時間と場所を特定します。

共同作業ツール

Ithacaは、Packard Humanities Instituteのギリシャ碑文の最大のデジタルデータセットでトレーニングされています。自然言語処理モデルは、単語を使用して一般的にトレーニングされます。なぜなら、それらが文中でどのように現れ、それらの間の関係が追加の文脈と意味を提供するからです。たとえば、「昔々」は、個々の文字や単語を別々に見るよりも意味があります。しかし、歴史家がIthacaで分析したい碑文の多くは損傷しており、しばしばテキストの一部が欠落しています。これに対応するために、私たちは単語と個々の文字の両方を入力として使用してモデルをトレーニングしました。モデルの中核となる疎な自己注意メカニズムは、これらの2つの入力を並列に評価することで、必要に応じて碑文を評価することができるようにしています。

<img alt="図3. Ithacaの出力。(a)アテネの碑文(IG II² 116)での6つの欠落文字(ダッシュ)の復元予測。上部の復元結果(緑色)は正解です(συμμαχία、「同盟」)。赤色で強調された仮説(ἐκκλησία、「議会」およびπροξενία、「国家と外国人の条約」)は、アテネの政治布告に一般的に現れることから、Ithacaの文脈への受容性が示されています。(b)アモルゴスの碑文(IG XII 7, 2)の地理的所属。Ithacaのトップの予測は正解であり、最も近い予測は隣接する地域です。(c)デロスの碑文(IG XI 4, 579)の日付分布。正解の日付範囲300-250 BCEは灰色で示され、Ithacaの予測分布は黄色であり、平均は273 BCE(緑色)です。図3. Ithacaの出力。(a)アテネの碑文(IG II² 116)での6つの欠落文字(ダッシュ)の復元予測。上部の復元結果(緑色)は正解です(συμμαχία、「同盟」)。赤色で強調された仮説(ἐκκλησία、「議会」およびπροξενία、「国家と外国人の条約」)は、アテネの政治布告に一般的に現れることから、Ithacaの文脈への受容性が示されています。(b)アモルゴスの碑文(IG XII 7, 2)の地理的所属。Ithacaのトップの予測は正解であり、最も近い予測は隣接する地域です。(c)デロスの碑文(IG XI 4, 579)の日付分布。正解の日付範囲300-250 BCEは灰色で示され、Ithacaの予測

イサカの価値を最大限に活用するために、私たちはイサカの結果を歴史家が簡単に解釈できるようにするためのいくつかの視覚的支援も作成しました:

  • 復元の仮説:イサカは歴史家が選ぶためのいくつかの復元の予測仮説を生成します。これは彼らの専門知識を利用して行われます。
  • 地理的帰属:イサカは単一の出力ではなく、可能な予測全体に対する確率分布を歴史家に与えることで、不確実性を示します。その結果、84の異なる古代地域に対して確信度を表す確率を返します。これらの結果を地図上に可視化し、古代世界全体の潜在的な地理的つながりを明らかにします。
  • 年代の帰属:テキストの年代を特定する際、イサカは800 BCEから800 CEまでのすべての十年にわたる予測された日付の分布を生成します。これにより、歴史家は特定の日付範囲におけるモデルの信頼性を視覚化することができ、貴重な歴史的洞察を提供する可能性があります。
  • 重要性マップ:イサカはコンピュータビジョンで一般的に使用される技術を使用して、予測に最も貢献する入力シーケンスを特定する方法を使用して結果を歴史家に伝えます。出力は、欠落したテキスト、位置、および日付のためのイサカの予測に寄与した単語を異なる色の強度で強調表示します。
図4. このテキスト(IG II² 116、アテネ361/0 BCE)はアテネとテッサリアの人々との同盟を記録しています。重要な文脈における単語「アテナイ人」と「テッサリア人」に「同盟」という破損した単語を復元する際に、イサカが「フォーカス」していることを重要性マップを使用して視覚化することができます。

歴史的な論争への貢献

私たちの実験的評価は、イサカの設計上の決定と視覚化支援が研究者が結果を解釈するのを容易にする方法を示しています。私たちが協力した専門の歴史家は、古代のテキストを復元するために単独で作業すると25%の精度を達成しました。しかし、イサカを使用すると、彼らのパフォーマンスは72%に向上し、モデルの個別のパフォーマンスを上回り、歴史的な解釈を進めるための人間と機械の協力の潜在能力を示しています。また、歴史的イベントの相対的な年代を確立し、現在の方法論的な論争にも貢献することができます。

たとえば、歴史家たちは現在、ソクラテスやペリクレスなどの著名な人物が生きていた時期に行われた一連の重要なアテネの布告の日付について意見が分かれています。これらの布告はかつては446/445 BCEより前に書かれたと考えられていましたが、新しい証拠は420年代BCEの日付を示唆しています。これは小さな違いのように思えるかもしれませんが、これらの布告は古代アテネの政治史の理解に基礎を提供しています。

私たちのトレーニングデータセットには446/445 BCEの早い数字が含まれています。イサカの予測をテストするために、私たちはその日付の銘文を含まないデータセットで再トレーニングし、これらの非公開のテキストを分析のために提出しました。驚くべきことに、イサカの布告に対する平均予測日付は421 BCEであり、最新の日付の突破口と一致しています。これは機械学習がギリシャ史上最も重要な瞬間の一つに関する論争に貢献する方法を示しています。

図5. イサカの予測とパッカード人文科学研究所(PHI)データセットの正解と最近の歴史的再評価との比較。PHIのラベルは再評価から平均で27年ずれており、イサカの予測は新たに提案された正解から平均でわずか5年ずれています。

私たちは、Ithacaのようなツールや機械学習と人文科学の協力の可能性はこれから始まるに過ぎないと考えています。古代ギリシャは地中海世界の理解において重要な役割を果たしていますが、それは文明の広範なグローバルな一部に過ぎません。そのため、私たちは現在、他の古代言語に訓練されたIthacaのバージョンを開発しており、歴史家は既存のアーキテクチャを使用して、アッカド語からデモティック語、ヘブライ語からマヤ語など他の古代の文章システムの研究にすでにデータセットを利用することができます。IthacaのようなモデルがAIと人文科学の協力の可能性を解き放ち、人類の歴史の中で最も重要な時代について研究や執筆する方法に革命的な影響を与えることを望んでいます。

  • 論文を読む
  • Ithacaのインタラクティブバージョンを探索する
  • オープンソースのコードを取得する
  • このブログのギリシャ語訳を読む

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「モジュラーディフュージョンを紹介します:PyTorchを使用してディフュージョンモデルを設計およびトレーニングするためのPythonライブラリ」

marktechpostのためにクールなAIプロジェクトを常に探しており、今回はRedditで投稿されたこのプロジェクト”Modular Di...

AI研究

「AIを活用したツールにより、3Dプリント可能なモデルの個別化が容易になります」

Style2Fabを使用することで、メーカーは補助具などの3Dプリンタで作成可能なオブジェクトのモデルを迅速にカスタマイズできま...

機械学習

「マルチタスクアーキテクチャ:包括的なガイド」

多くのタスクを実行するためにニューラルネットワークを訓練することは、マルチタスク学習として知られていますこの投稿では...

機械学習

ビジネスにおけるオープンソースと専有モデルの選択:生成型人工知能の展開において

ジェネレーティブAIへの関心の高まりにより、2023年中頃には約350社の企業がこの分野に参入しました[1]それぞれが基礎モデル...

AIニュース

「ReactでOpenAIの力を解き放つ:ユーザーエクスペリエンスを革新する」

このブログでは、ReactでOpenAIを使用してユーザーエクスペリエンスを革新する方法を探求しますOpenAIをReactと統合すること...

機械学習

オペレーションの頭脳:人工知能とデジタルツインで手術の未来を地図化するアトラスメディテック

アスリートが試合のためにトレーニングし、俳優が公演のためにリハーサルするように、外科医も手術の前に準備をします。 今、...