Learn more about Search Results A - Page 326

「SD-Small」と「SD-Tiny」の知識蒸留コードと重みのオープンソース化

近年、AIコミュニティでは、Falcon 40B、LLaMa-2 70B、Falcon 40B、MPT 30Bなど、より大きく、より高性能な言語モデルの開発が著しく進んでいます。また、SD2.1やSDXLなどの画像領域のモデルでも同様です。これらの進歩は、AIが達成できることの境界を押し広げ、高度に多様かつ最先端の画像生成および言語理解の能力を可能にしています。しかし、これらのモデルのパワーと複雑さを驚嘆しながらも、AIモデルをより小さく、効率的に、そしてよりアクセスしやすくするという成長するニーズの認識が不可欠です。特に、オープンソース化によってこれらのモデルを利用可能にすることが求められています。 Segmindでは、生成型AIモデルをより速く、安価にする方法に取り組んできました。昨年、voltaMLという加速されたSD-WebUIライブラリをオープンソース化しました。これはAITemplate/TensorRTベースの推論高速化ライブラリであり、推論速度が4~6倍向上しました。生成モデルをより速く、小さく、安価にする目標に向けて、私たちは圧縮されたSDモデル「SD-Small」と「SD-Tiny」の重みとトレーニングコードをオープンソース化しています。事前学習済みのチェックポイントはHuggingfaceで利用可能です🤗 知識蒸留 私たちの新しい圧縮モデルは、知識蒸留(KD)技術に基づいてトレーニングされており、この論文に大きく依存しています。著者は、いくつかのUNetレイヤーを削除し、学習された生徒モデルの重みを説明したブロック除去知識蒸留法について説明しています。論文で説明されているKDの手法を使用して、圧縮モデル2つをトレーニングしました。🧨 diffusersライブラリを使用してトレーニングした「Small」と「Tiny」は、ベースモデルと比較してそれぞれ35%と55%少ないパラメータを持っており、ベースモデルと同様の画像品質を実現しています。私たちはこのリポジトリで蒸留コードをオープンソース化し、Huggingfaceで事前学習済みのチェックポイントを提供しています🤗 ニューラルネットワークの知識蒸留トレーニングは、先生が生徒をステップバイステップで指導するのと似ています。大きな先生モデルは大量のデータで事前トレーニングされ、その後、より小さなモデルは小規模なデータセットでトレーニングされ、クラシカルなトレーニングと共に、大きなモデルの出力を模倣するようになります。 この特定の種類の知識蒸留では、生徒モデルは通常の拡散タスクである純粋なノイズからの画像の復元を行うようにトレーニングされますが、同時に、モデルは大きな先生モデルの出力と一致するようになります。出力の一致はU-netの各ブロックで行われるため、モデルの品質はほとんど保たれます。したがって、前述のアナロジーを使用すると、このような蒸留中、生徒は質問と回答だけでなく、先生の回答からも学び、回答に至る方法もステップバイステップで学ぼうとします。これを達成するために、損失関数には3つのコンポーネントがあります。まず、ターゲット画像の潜在変数と生成された画像の潜在変数の間の従来の損失です。次に、先生が生成した画像の潜在変数と生徒が生成した画像の潜在変数の間の損失です。そして最後に、最も重要なコンポーネントであるフィーチャーレベルの損失です。これは、先生と生徒の各ブロックの出力の間の損失です。 これらすべてを組み合わせて、知識蒸留トレーニングが成り立ちます。以下は、論文「テキストから画像への拡散モデルのアーキテクチャ圧縮について」(Shinkookら)からのアーキテクチャの例です。 画像はShinkookらによる論文「テキストから画像への拡散モデルのアーキテクチャ圧縮について」から取得 私たちは、ベースとなる先生モデルとしてRealistic-Vision 4.0を選び、高品質な画像の説明を持つLAION Art Aestheticデータセットでトレーニングしました(画像スコアが7.5以上のもの)。論文とは異なり、私たちはSmallモードでは100Kステップ、Tinyモードでは125Kステップで1M枚の画像で2つのモデルをトレーニングしました。蒸留トレーニングのコードはこちらで見つけることができます。 モデルの使用方法 モデルは🧨 diffusersのDiffusionPipelineを使用して利用できます from diffusers import DiffusionPipeline…

「AIの創造性の測定」 AIの創造性を測定する

人工知能の創造力を定量化するには、創造性の定義を理解する必要があります

「メタは、AIチャットボットを個性付けて使用できると報告されています」

「エイブラハム・リンカーンとチャットしたいですか?FacebookのオーナーであるMetaは人工知能のリーダーですが、すでに高度なチャットボットを持つライバルもたくさん存在しています」

『PDFを扱うための4つのAIツール – ボーナスツールもあり』

「情報を探し求めるためにPDFドキュメントの山をひたすら漁っていることはありませんか?私たちは、これがあなたが認めたくなるよりも頻繁に起こると確信しています特に整理されていないデータベースでの情報の手動検索は、時間がかかりイライラしますしかし心配しないでください!最近では、AI搭載のPDFツールがあり、状況を好転させることができます以下に、PDFを扱うための4つのAIツールとボーナスツールを紹介します詳細はこちらをご覧ください」

「ChatGPTを使用して高変換率のランディングページを作成する」

「私たちは100のランディングページを分析し、すべての教訓をChatGPTのプロンプトにまとめました自分で確認してください...」

「2023年8月の10の最高のAIフェイススワップツール」

人工知能(AI)は私たちの生活の多くの側面を革命化しましたその技術の1つの応用は、AIフェイススワップツールですこれらのツールは、生成的対抗ネットワーク(GAN)などの高度なコンピュータビジョン技術と深層学習アルゴリズムを使用して、写真や動画で1人の顔を別の人の顔と入れ替えます』

「ODSC West Bootcampプログラムから期待できること」

データサイエンスのキャリアをスタートする際、どの道を選ぶか迷うことがあります不確実性のある状況から出発する際には、従来のブートキャンプの費用(時間とお金)を正当化するのは難しいですODSC Westのミニブートキャンプでは、10月30日から11月2日まで、...

「ストリーミング巨人Netflix、ライターストライキ継続中にAIジョブを$900,000でリストアップ」

「ストリームサービスが好きで、機械学習製品管理に熱心な方はいらっしゃいますか?もしそうなら、最近Netflixが掲示した求人情報に目を通してみると良いかもしれませんAIに特化したポジションで、年収は高い範囲の90万ドルとなっています...」

予測API:DjangoとGoogle Trendsの例

Djangoは高水準のPythonウェブフレームワークです速く、安全で、スケーラブルに設計されており、複雑さが増すことが予想される堅牢なウェブアプリケーションの開発に人気の選択肢です...

「GoogleのRT-2 AIモデルに会いましょう – 人間のように学ぶロボット」

「ニューラルネットワークは人間の脳の動作に触発されていますが、完全に同じではありませんしかし、Googleの新しいRT-2モデルが約束どおりに機能すれば、人間のようなAIへの重要な一歩となるかもしれませんGoogleのDeepMindが紹介したこのモデルは、ウェブと...」

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us