Learn more about Search Results huggingface.co - Page 9

ハギングフェイスがIDEFICSを導入:視覚言語モデルを活用した先駆的なオープンマルチモーダル対話AI

人工知能のダイナミックな景色において、続く挑戦がこの分野の進歩に影を落としています:最先端のAIモデルについての謎。これらの専有の驚異は確かに印象的ですが、オープンな研究開発の進展を隠す秘密主義の雰囲気を保ち続けています。この巨大なギャップを埋めるため、Hugging Faceの専門の研究チームが驚異的なブレークスルーを演出しました – IDEFICS(Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS)の誕生です。このマルチモーダル言語モデルは単なる競争相手ではありません。その能力に関しては、専有の競合モデルと肩を並べています。 さらに、IDEFICSは公に利用可能なデータを利用して、新鮮な透明性で動作します。この取り組みの背後にある推進力は、AIにおけるオープンモデルの進化、アクセシビリティ、および協力的なイノベーションを促進することです。テキストと画像の両方の入力を適切に処理して一貫した会話の出力を生み出すことができるオープンなAIモデルが求められる世界において、IDEFICSは進歩の光として登場します。 現在の方法論は称賛されるものですが、専有の制約にはまだ絡まっています。しかしIDEFICSを指導するビジョナリーたちはより大胆な提案をしています:専有の競合モデルと同等のパフォーマンスを持ち、公に利用可能なデータにのみ依存するオープンアクセスモデルです。この画期的な創造物はFlamingoの能力に根ざしており、80兆パラメータバリアントと90億パラメータバリアントの2つの形態で提供されています。これにより、さまざまなアプリケーションに適応できるようになっています。研究チームの願望は単なる進歩を超えており、マルチモーダルな会話型AIの空白を埋め、他の人が追随するための舞台を設けることです。 IDEFICSが登場し、マルチモーダルモデルの真の天才です。画像とテキストのシーケンスを取り込んで、これらの入力を文脈を持った一貫した会話テキストに変換します。この革新は、チームの透明性の大きな使命とシームレスに結びついています。このモデルの基盤は、公に利用可能なデータとモデルの塔であり、エントリーの壁を効果的に壊します。そのパフォーマンスには証拠があります:IDEFICSは、簡単に画像に関するクエリに答えたり、視覚的なストーリーを生き生きと描写したり、複数の画像に根ざしたストーリーを創り出したりすることで驚かせます。80兆と90億のパラメータバリアントのタンデムは、前例のないスケーラビリティを持っています。このマルチモーダルの驚異は、煩雑なデータキュレーションとモデル開発を経て誕生し、オープンな研究とイノベーションの物語に新たな章を切り開いています。 https://huggingface.co/blog/idefics 専有の競合モデルによって引き起こされる困難に対する響きを持つIDEFICSは、オープンイノベーションの火の玉として登場します。創造だけでなく、このモデルはアクセス可能で協力的なAIの開発への歩みを象徴しています。テキストと画像の入力の融合が、産業全体にわたる変革の到来を告げています。透明性、倫理的な審査、共有の知識への研究チームの献身は、AIの潜在能力を具現化し、大勢の人々に利益をもたらすことになります。その本質において、IDEFICSはオープンな研究の力を具体化し、超越的なテクノロジーの新時代を予示しています。AIコミュニティがこの鼓舞に呼応するにつれて、可能性の境界は広がり、より明るく包括的なデジタルの明日が約束されます。

あなたのGen AIプロジェクトで活用するための10のヒントとトリック

現在、実際に利用されている生成型AIアプリケーションはあまり多くはありませんここで言っているのは、それらがエンドユーザーによって展開され、活発に使用されていることを意味します(デモ、POC、および抽出型AIは含まれません)生成型AIは…

「IDEFICSをご紹介します:最新の視覚言語モデルのオープンな再現」

私たちは、IDEFICS(Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS)をリリースすることを喜んでいます。IDEFICSは、Flamingoに基づいたオープンアクセスのビジュアル言語モデルです。FlamingoはDeepMindによって開発された最先端のビジュアル言語モデルであり、公開されていません。GPT-4と同様に、このモデルは画像とテキストの任意のシーケンスを受け入れ、テキストの出力を生成します。IDEFICSは、公開されているデータとモデル(LLaMA v1およびOpenCLIP)のみを使用して構築されており、ベースバージョンと指示付きバージョンの2つのバリアントが9,000,000,000および80,000,000,000のパラメーターサイズで利用可能です。 最先端のAIモデルの開発はより透明性を持つべきです。IDEFICSの目標は、Flamingoのような大規模な専有モデルの能力に匹敵するシステムを再現し、AIコミュニティに提供することです。そのために、これらのAIシステムに透明性をもたらすために重要なステップを踏みました。公開されているデータのみを使用し、トレーニングデータセットを探索するためのツールを提供し、このようなアーティファクトの構築における技術的な教訓とミスを共有し、リリース前に敵対的なプロンプトを使用してモデルの有害性を評価しました。IDEFICSは、マルチモーダルAIシステムのよりオープンな研究のための堅固な基盤として機能することを期待しています。また、9,000,000,000のパラメータースケールでのFlamingoの別のオープン再現であるOpenFlamingoなどのモデルと並んでいます。 デモとモデルをハブで試してみてください! IDEFICSとは何ですか? IDEFICSは、80,000,000,000のパラメーターを持つマルチモーダルモデルであり、画像とテキストのシーケンスを入力とし、一貫したテキストを出力します。画像に関する質問に答えることができ、視覚的なコンテンツを説明し、複数の画像に基づいて物語を作成することができます。 IDEFICSは、Flamingoのオープンアクセス再現であり、さまざまな画像テキスト理解ベンチマークで元のクローズドソースモデルと同等のパフォーマンスを発揮します。80,000,000,000および9,000,000,000のパラメーターの2つのバリアントがあります。 会話型の使用事例に適した、idefics-80B-instructとidefics-9B-instructのファインチューニングバージョンも提供しています。 トレーニングデータ IDEFICSは、Wikipedia、Public Multimodal Dataset、LAION、および新しい115BトークンのデータセットであるOBELICSのオープンデータセットの混合物でトレーニングされました。OBELICSは、ウェブからスクレイプされた141,000,000の交互に配置された画像テキストドキュメントで構成され、353,000,000の画像を含んでいます。 OBELICSの内容をNomic AIで探索できるインタラクティブな可視化も提供しています。 IDEFICSのアーキテクチャ、トレーニング方法論、評価、およびデータセットに関する詳細は、モデルカードと研究論文で入手できます。さらに、モデルのトレーニングから得られた技術的な洞察と学びを文書化しており、IDEFICSの開発に関する貴重な見解を提供しています。 倫理的評価…

「ROUGEメトリクス:大規模言語モデルにおける要約の評価」

「従来のモデルにおいて使用してきた指標であるAccuracy、F1スコア、またはRecallなどは、生成モデルの結果を評価するのに役立ちませんこれらのモデルでは、...」

「Amazon SageMaker JumpStartを使用したゼロショットテキスト分類」

自然言語処理(NLP)は、機械学習(ML)の分野であり、コンピュータに人間と同じようにテキストや話された言葉を理解する能力を与えることに関心があります最近では、トランスフォーマーアーキテクチャなどの最先端のアーキテクチャが使用され、テキスト要約、テキスト分類、エンティティ認識などのNLP下流タスクでほぼ人間のパフォーマンスを実現するために使用されています

AWS Marketplace上のHugging Faceプラットフォーム:AWSアカウントで支払いを行う

ハギングフェイスプラットフォームがAWS Marketplaceに登場しました。今日から、AWS Marketplaceを通じてハギングフェイスプラットフォームに購読することで、AWSアカウントでハギングフェイスの利用料金を直接支払うことができます。この新しい統合課金方法により、組織のすべてのメンバー、推論エンドポイント、スペースハードウェアのアップグレード、AutoTrainなど、人気のある機械学習モデル(Llama 2、StarCoder、BERTなど)の簡単なトレーニング、テスト、展開の使用料金の管理が容易になります。 ハギングフェイスをAWS Marketplaceで利用できるようにすることで、AIの採用の障壁を取り除き、大規模な言語モデルを活用する企業にとって利用が容易になります。今や、AWSの顧客はわずか数回のクリックでハギングフェイスアカウントに申し込み、AWSアカウントと接続することができます。 AWS Marketplaceを通じて購読することで、推論エンドポイントなどのハギングフェイス組織の利用料金は、組織のクレジットカードではなくAWSの請求書に自動的に表示されます。 私たちはこのローンチに興奮しています。これにより、AWSに頼る開発者に私たちのテクノロジーを提供し、ハギングフェイスサービスを利用する企業にとっても利便性が向上します。 はじめに AWSアカウントとハギングフェイスアカウントを接続する前に、次の前提条件を満たす必要があります: AWS Marketplaceの製品に申し込む権限がある有効なAWSアカウントにアクセスできること。 登録済みかつ確認済みのメールアドレスを持つハギングフェイス組織アカウントを作成していること(ユーザーアカウントは接続できません)。 「管理者」の役割を持つハギングフェイス組織に所属していること。 ハギングフェイスプラットフォームにログインしていること。 これらの要件を満たしている場合、AWSとハギングフェイスアカウントを接続する手順に進むことができます。 1. ハギングフェイスプラットフォームに申し込む 最初のステップは、AWS Marketplaceのオファリングに移動し、ハギングフェイスプラットフォームに申し込むことです。オファリングを開き、画面の右上にある「購入オプションを表示」をクリックします。 これで「購読」ページに移動し、価格の概要と購読方法が表示されます。オファリングに申し込むには、「購読」をクリックします。 申し込みが成功したら、画面の上部に「アカウントの設定」ボタンが表示される緑色のバナーが表示されます。ハギングフェイスアカウントとAWSアカウントを接続するには、「アカウントの設定」をクリックする必要があります。 ボタンをクリックすると、ハギングフェイスプラットフォームにリダイレクトされ、AWSアカウントとリンクするハギングフェイス組織アカウントを選択できます。アカウントを選択した後、「送信」をクリックします。…

ベントMLを使用したHugging Faceモデルのデプロイ:DeepFloyd IFのアクション

Hugging Faceは、モデルを簡単にアップロード、共有、展開することができるHubプラットフォームを提供しています。これにより、モデルをゼロからトレーニングするために必要な時間と計算リソースを開発者が節約することができます。ただし、実世界のプロダクション環境やクラウドネイティブの方法でモデルを展開することはまだ課題があります。 ここでBentoMLが登場します。BentoMLは、機械学習モデルのサービングと展開のためのオープンソースプラットフォームです。これは、従来の、事前トレーニング済みの、生成モデルおよび大規模言語モデルを組み込んだ本番向けのAIアプリケーションを構築、出荷、スケーリングするための統一されたフレームワークです。以下は、BentoMLフレームワークを高レベルで使用する方法です: モデルの定義:BentoMLを使用するには、機械学習モデル(または複数のモデル)が必要です。このモデルは、TensorFlowやPyTorchなどの機械学習ライブラリを使用してトレーニングできます。 モデルの保存:トレーニング済みのモデルをBentoMLのローカルモデルストアに保存します。これは、すべてのトレーニング済みモデルをローカルで管理し、サービングにアクセスするために使用されます。 BentoMLサービスの作成:モデルをラップし、サービスのロジックを定義するためにservice.pyファイルを作成します。これは、モデルの推論をスケールで実行するためのランナーを指定し、入力と出力の処理方法を定義するAPIを公開します。 Bentoのビルド:構成YAMLファイルを作成することで、すべてのモデルとサービスをパッケージ化し、コードと依存関係を含む展開可能なアーティファクトであるBentoを作成します。 Bentoの展開:Bentoが準備できたら、Bentoをコンテナ化してDockerイメージを作成し、Kubernetes上で実行することができます。または、Bentoを直接Yataiに展開することもできます。Yataiは、Kubernetes上での機械学習デプロイメントを自動化および実行するためのオープンソースのエンドツーエンドソリューションです。 このブログ投稿では、上記のワークフローに従ってDeepFloyd IFをBentoMLと統合する方法をデモンストレーションします。 目次 DeepFloyd IFの簡単な紹介 環境の準備 BentoMLモデルストアへのモデルのダウンロード BentoMLサービスの開始 Bentoのビルドとサービスの提供 サーバーのテスト 次のステップ DeepFloyd IFの簡単な紹介 DeepFloyd IFは、最先端のオープンソースのテキストから画像へのモデルです。Stable Diffusionのような潜在的な拡散モデルとは異なる運用戦略とアーキテクチャを持っています。…

「Swift Transformersのリリース:AppleデバイスでのオンデバイスLLMsの実行」

私はiOS/Macの開発者に多くの敬意を持っています。2007年にiPhone向けのアプリを書き始めたときは、まだAPIやドキュメントさえ存在しませんでした。新しいデバイスは、制約空間におけるいくつかの見慣れない決定を採用しました。パワー、画面の広さ、UIのイディオム、ネットワークアクセス、永続性、遅延などの組み合わせは、それまでとは異なるものでした。しかし、このコミュニティはすぐに新しいパラダイムに適した優れたアプリケーションを作り出すことに成功しました。 私はMLがソフトウェアを構築する新しい方法だと信じており、多くのSwift開発者が自分のアプリにAI機能を組み込みたいと思っていることを知っています。MLのエコシステムは大きく成熟し、さまざまな問題を解決する数千のモデルが存在しています。さらに、LLM(Language and Learning Models)は最近、ほぼ汎用のツールとして登場しました。テキストやテキストに似たデータで作業するため、新しいドメインに適応させることができます。私たちは、LLMが研究所から出てきて、誰にでも利用可能なコンピューティングツールになりつつあるという、コンピューティングの歴史上の転換点を目撃しています。 ただし、LlamaのようなLLMモデルをアプリに使用するには、多くの人が直面し、単独で解決する必要があるタスクがあります。私たちはこの領域を探求し、コミュニティと一緒に取り組みを続けたいと考えています。開発者がより速く開発できるように、ツールとビルディングブロックのセットを作成することを目指しています。 今日は、このガイドを公開し、MacでCore MLを使用してLlama 2などのモデルを実行するために必要な手順を説明します。また、開発者をサポートするためのアルファ版のライブラリとツールもリリースしています。MLに興味のあるすべてのSwift開発者にPRやバグレポート、意見を提供して、一緒に改善するよう呼びかけています。 さあ、始めましょう! 動画: Llama 2 (7B)チャットモデルがCore MLを使用してM1 MacBook Proで実行されています。 今日リリース swift-transformersは、テキスト生成に焦点を当てたSwiftで実装されたtransformersライクなAPIを開発中のSwiftパッケージです。これはswift-coreml-transformersの進化版であり、より広範な目標を持っています。Hubの統合、任意のトークナイザのサポート、プラグイン可能なモデルなど。 swift-chatは、パッケージの使用方法を示すシンプルなアプリです。 transformersモデルのCore ML変換のための更新されたバージョンのexporters、Core ML変換ツールであるtransformers-to-coremlの更新されたバージョン。 これらのテキスト生成ツールで使用するために準備されたLlama…

「Hugging Face Transformersライブラリを解剖する」

これは、実践的に大規模言語モデル(LLM)を使用するシリーズの3番目の記事ですここでは、Hugging Face Transformersライブラリについて初心者向けのガイドを提供しますこのライブラリは、簡単で...

「医療分野における生成型AI」

はじめに 生成型人工知能は、ここ数年で急速に注目を集めています。医療と生成型人工知能の間に強い関係性が生まれていることは驚くことではありません。人工知能(AI)はさまざまな産業を急速に変革しており、医療分野も例外ではありません。AIの特定のサブセットである生成型人工知能は、医療分野において画期的な存在となっています。 生成型AIシステムは、新しいデータ、画像、さらには完全な芸術作品を生成することができます。医療分野では、この技術は診断、新薬の発見、患者ケア、医学研究の向上において非常に有望です。本記事では、医療分野における生成型人工知能の潜在的な応用と利点、実装上の課題、倫理的な考慮事項について探究します。 学習目標 GenAIとその医療分野への応用 GenAIの医療分野における潜在的な利点 医療分野における生成型AIの実装上の課題と制約 医療分野における生成型AIの将来的な展望 本記事は、Data Science Blogathonの一環として公開されました。 医療分野における生成型人工知能の潜在的な応用 医療分野において、GenAIをどのように活用できるかについて、いくつかの研究が行われています。GenAIは、新薬のための分子構造や化合物の生成に影響を与え、有望な薬剤候補の同定と発見を促進しています。これにより、先端技術を活用しながら時間とコストを節約することが可能です。以下は、これらの潜在的な応用の一部です: 医療画像および診断の向上 医療画像は、診断と治療計画において重要な役割を果たしています。生成型AIアルゴリズム(生成対抗的ネットワーク(GAN)や変分オートエンコーダー(VAE)など)は、医療画像解析を大幅に改善しています。これらのアルゴリズムは、実際の患者データに似た合成医療画像を生成することができ、機械学習モデルのトレーニングと検証に役立ちます。また、限られたデータセットを補完するために追加のサンプルを生成することで、画像に基づく診断の正確性と信頼性を向上させることもできます。 薬剤の発見と開発の促進 新薬の発見と開発は、複雑で時間がかかり、費用がかかる作業です。生成型AIは、所望の特性を持つ仮想化合物や分子を生成することで、このプロセスを大幅に加速することができます。研究者は、生成モデルを用いて広大な化学空間を探索し、新たな薬剤候補を同定することができます。これらのモデルは既存のデータセット(既知の薬剤構造と関連する特性を含む)から学習し、望ましい特性を持つ新しい分子を生成します。 個別化医療と治療 生成型AIは、患者データを活用して個別化された治療計画を作成することで、個別化医療を革新する潜在能力を持っています。電子健康記録、遺伝子プロファイル、臨床結果などの大量の患者情報を分析することにより、生成型AIモデルは個別化された治療の推奨を生成することができます。これらのモデルはパターンを特定し、病気の進行を予測し、介入に対する患者の反応を推定することができるため、医療提供者は情報に基づいた意思決定を行うことができます。 医学研究と知識生成 生成型AIモデルは、特定の特性と制約を満たす合成データを生成することで、医学研究を支援することができます。合成データは、機密性の高い患者情報の共有に関連するプライバシーの問題を解決しながら、研究者が有益な洞察を抽出し、新たな仮説を開発することができます。 また、生成型AIは臨床試験のための合成患者コホートを生成することもできます。これにより、研究者はさまざまなシナリオをシミュレートし、実際の患者に対する高価で時間のかかる試験を実施する前に治療の効果を評価することができます。この技術は、医学研究を加速し、イノベーションを推進し、複雑な疾患に対する理解を広げる可能性があります。 事例研究: CPPE-5…

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us