ドキュメントAIの加速

ドキュメントAIの進化

企業は、デジタルワークフローではアクセスできない知識を含むドキュメントで溢れています。これらのドキュメントには、手紙、請求書、フォーム、レポート、領収書などさまざまなものがあります。テキスト、ビジョン、マルチモーダルAIの改善により、その情報を解放することが可能になりました。この投稿では、チームがオープンソースのモデルを使用してカスタムソリューションを無償で構築する方法を紹介します!

ドキュメントAIには、イメージ分類、イメージからテキストへの変換、ドキュメントの質問応答、表の質問応答、ビジュアルの質問応答など、多くのデータサイエンスのタスクが含まれています。この投稿では、Document AI内のユースケースのタクソノミーとそれに対する最適なオープンソースモデルに焦点を当てています。次に、ライセンス、データの準備、モデリングについて説明します。この投稿では、Webデモ、ドキュメンテーション、モデルへのリンクがあります。

ユースケース

ドキュメントAIソリューションを構築するための一般的なユースケースは少なくとも6つあります。これらのユースケースは、ドキュメントの入力と出力の種類が異なります。企業のドキュメントAIの問題を解決する際には、しばしばアプローチの組み合わせが必要です。

DiTを使用したドキュメントのレイアウト分析。

ドキュメントのレイアウト分析では、一般的にオブジェクト検出モデルの評価によく使用されるmAP(平均適合率)メトリックが使用されます。レイアウト分析の重要なベンチマークはPubLayNetデータセットです。最新の状態のLayoutLMv3は、全体的なmAPスコアが0.951(ソース)を達成しています。

次のステップ

Document AIの可能性を見ていますか?私たちは日々、最先端のビジョンと言語モデルを使用して、企業と一緒に貴重なデータを解放するために取り組んでいます。この投稿では、さまざまなデモへのリンクを含めたので、それらを出発点として活用してください。投稿の最後のセクションには、ビジュアルの質問応答など、独自のモデルをコーディングし始めるためのリソースが含まれています。ソリューションの構築を開始する準備ができたら、Hugging Faceパブリックハブは素晴らしい出発点です。さまざまなDocument AIモデルがホストされています。

Document AIの取り組みを加速させたい場合、Hugging Faceがお手伝いします。エンタープライズアクセラレーションプログラムを通じて、AIのユースケースに関するガイダンスを提供するために企業と提携しています。Document AIの場合、事前学習モデルの構築、ファインチューニングタスクの精度向上、最初のDocument AIユースケースに取り組むための総合的なガイダンスなどを支援することができます。

また、トレーニング(AutoTrain)や推論(SpacesまたはInference Endpoints)製品の大規模な使用に対して、計算クレジットのバンドルを提供することもできます。

リソース

多くのDocument AIモデルのノートブックとチュートリアルは以下で見つけることができます:

  • NielsのTransformers-Tutorials
  • PhilippのHugging Face TransformersによるDocument AI

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「マーシャンの共同創設者であるイータン・ギンスバーグについてのインタビューシリーズ」

エタン・ギンズバーグは、マーシャンの共同創業者であり、すべてのプロンプトを最適なLLMに動的にルーティングするプラットフ...

人工知能

「ゲイリー・ヒュースティス、パワーハウスフォレンジクスのオーナー兼ディレクター- インタビューシリーズ」

ゲイリー・ヒュースティス氏は、パワーハウスフォレンジックスのオーナー兼ディレクターであり、ライセンスを持つ私立探偵、...

AIテクノロジー

「LXTのテクノロジーバイスプレジデント、アムル・ヌール・エルディン - インタビューシリーズ」

アムル・ヌール・エルディンは、LXTのテクノロジー担当副社長ですアムルは、自動音声認識(ASR)の文脈での音声/音響処理と機...

データサイエンス

2023年にAmazonのデータサイエンティストになる方法は?

ほとんどのビジネスは現在、膨大な量のデータを生成し、編集し、管理しています。しかし、ほとんどのビジネスは、収集したデ...

人工知能

「リオール・ハキム、Hour Oneの共同創設者兼CTO - インタビューシリーズ」

「Hour Oneの共同創設者兼最高技術責任者であるリオール・ハキムは、専門的なビデオコミュニケーションのためのバーチャルヒ...

人工知能

「コマンドバーの創設者兼CEO、ジェームズ・エバンスによるインタビューシリーズ」

ジェームズ・エバンズは、CommandBarの創設者兼CEOであり、製品、マーケティング、顧客チームを支援するために設計されたAIパ...