Learn more about Search Results リリース - Page 15
- You may be interested
- 「LK-99超伝導体:突破かもしれない、新た...
- 私たちはどのように大規模な言語モデルを...
- キュービットマジック:量子コンピューテ...
- 「CT2Hairに会ってください:ダウンストリ...
- 大規模なMLライフサイクルの統治、パート1...
- 「サリー大学の研究者が開発した新しいソ...
- QA-LoRA:GPUで量子化された大規模言語モ...
- ナノスケールで3Dプリントされた光学用グラス
- 「Amazon Redshift」からのデータを使用し...
- 「新たなホワイトハウスの協定に基づき、A...
- アップルの研究者が提案する「大規模な言...
- 「Decafと出会う:顔と手のインタラクショ...
- 「LangchainとOpenAIを使用したGoogleドキ...
- クラゲ、猫、ヘビ、宇宙飛行士は何を共有...
- 「Pythonにおける数理最適化入門」
このAIニュースレターはあなたが必要とするものです#76
今週、私たちはトランスフォーマーや大規模な言語モデル(LLM)の領域を超えた重要なAIの進展に焦点を当てました最近の新しいビデオ生成拡散ベースのモデルの勢いについて…
2024年に使用するためのトップ5の生成AIライブラリ
イントロダクション テクノロジーの進化する世界において、人工知能(AI)は変革的な力として登場しました。基本的なアルゴリズムから最新の機械学習モデルの洗練まで、AIの旅路は確かに革命的であった。そして、ジェネレーティブAIライブラリの出現により、魅惑的な章が展開されています。しかし、ジェネAIとは一体何でしょうか? ジェネレーティブAIと共に未来に踏み出しましょう!従来のモデルとは異なり、ジェネAIは産業を再構築するため新たなデータを生成します。ChatGPTのようなツールが道を切り開き、ビジネスの景観を変えています。最新のAIツールの「2024年のトップ5ジェネレーティブAIライブラリ」を探索し、革新を再定義し、ユーザーエクスペリエンスを革命化するパワーと潜在能力を解き放ちましょう。これらのライブラリは、AIの進化の最前線を示しています。ジェネレーティブAIの未来へ、一緒にこのエキサイティングな旅に参加しましょう! ジェネレーティブAIライブラリとは何ですか? ジェネAIライブラリは、ジェネレーティブ人工知能の基盤となる、事前学習済みのモデルとアルゴリズムのリポジトリです。これらのライブラリは、AIの創造的なポテンシャルに一から始めることなく、開発者や企業がアクセスできるようにするものです。学習されたパターンとデータの基盤を提供することで、ジェネAIライブラリはテキストや音楽、ビジュアルなど多様な出力の生成を可能にします。これらのライブラリを活用することで、開発プロセスが効率化され、革新と効率性が促進されます。ジェネAIライブラリは、幅広いアプリケーションと産業に対して、高度なAIの機能を民主化する役割を果たしています。 実践的な学習でジェネレーティブAIのゲームをアップグレードしましょう。当社のジェネAI Pinnacle Programで、ベクトルデータベースの驚異を発見しましょう! 2024年に使用するトップ5ジェネレーティブAIライブラリ 1. Open AI OpenAIのAPIは、ジェネAIの世界に没入した専門家にとって、革新的なツールとして位置づけられます。柔軟な「テキストイン、テキストアウト」のインターフェースを提供するこのAPIは、一般的な解決策として際立っており、ジェネAIの専門家が日常の業務やプロジェクトにシームレスに統合することが可能です。ほとんどの英語のタスクに適用可能な柔軟性があり、実験、開発、探索に使える広範なプレイグラウンドを提供します。 APIは、最小限の例での理解とタスクの実行に優れています。ジェネAIのプログラミングにおいて直感的な選択肢であり、プロフェッショナルは複雑なシステムの問題ではなく、創造的な出力に集中することができます。タスク固有のトレーニングによるパフォーマンスの向上も、ユーザーが提供したデータセットやフィードバックに基づくカスタマイズを可能にします。OpenAIはシンプルさに重点を置くことで、さまざまなユーザーベースにアクセス可能な状態を確保しており、その技術の継続的なアップグレードは、機械学習の急速な進化に適応することへの献身を示しています。 さらに、OpenAIは負の影響を及ぼすアプリケーションに対して慎重なモニタリングとアクセスの終了を行う責任あるAIの使用に重点を置いています。プライベートベータ版のリリースはユーザーの安全性への取り組みを反映し、言語技術の安全関連の研究を継続して行っています。OpenAIのAPIを使用するジェネAIの実践者は、ポジティブなAIシステムへの貢献となる強力なツールを作成しています。このAPIは、収益を超えて一般的なAIの進歩を推進し、障壁を取り除き、ジェネAIコミュニティをさまざまな可能性へと前進させるのです。 2. PandasAI PandasAIは、革新的なジェネAIパワーを備えたデータ分析ライブラリであり、ジェネAIの専門家にとって日常の業務の風景を再構築します。広く使われているPandasライブラリを基盤に構築されたPandasAIは、ジェネAIモデルをシームレスに統合することで生産性を向上させます。前処理やデータの可視化などの伝統的なPandasタスクは、ジェネAIの能力によって高められ、データフレームに会話の要素を導入します。 PandasAIの魅力は、複雑なコーディングプロセスを自然な言語インターフェースに変換することにあります。ジェネAIによって、データサイエンティストは自然な言語でデータセットと会話するだけで簡単にクエリを実行することができます。この革新により、前処理や分析フェーズが大幅に迅速化し、従来のコーディングプラクティスとは異なるアプローチが可能となります。このライブラリは、テック系とノンテック系の両方のプロフェッショナルがデータセットと簡単にやりとりできる新たな可能性を開きます。 パンダのAIの中心には、ジェネレーティブ人工知能(GenAI)があります。GenAIは既存のデータのパターンを特定することで、多様なデータタイプを生成することができる一部の人工知能です。GenAIを活用することで、パンダのAIはユーザーが複雑なコードを書く必要なく、自然言語で意図を表現し、その指示が正確に実行される新しい時代をもたらします。この変革的なアプローチは、日常のタスクを効率化するだけでなく、ジェネレーティブAIの領域で包括的かつ効率的なデータ分析プロセスの道を開きます。 3. HuggingFace Transformers HuggingFace…
パフォーマンスの向上と最適化されたリソース使用のためのダイナミックなLoRAローディング
私たちは、拡散モデルに基づくLoRAのハブ内の推論速度を大幅に高速化することができました。これにより、計算リソースを節約し、より良いユーザーエクスペリエンスを提供することができました。 モデルへの推論を行うには、2つのステップがあります: ウォームアップフェーズ – モデルのダウンロードとサービスのセットアップ(25秒)。 推論ジョブ自体(10秒)。 これらの改善により、ウォームアップ時間を25秒から3秒に短縮することができました。数百の異なるLoRAに対する推論を、たった5つのA10G GPU以下で提供することができます。さらに、ユーザーリクエストへの応答時間は35秒から13秒に短縮されました。 一つのサービスで多くの異なるLoRAを動的に提供するために、Diffusersライブラリで開発された最近の機能を活用する方法についてもっと話しましょう。 LoRA LoRAは「パラメータ効率」(PEFT)メソッドの一環である、微調整技術です。このメソッドは、微調整プロセスによって影響を受けるトレーニング可能なパラメータの数を減らすことを試みます。微調整の速度を高めながら、微調整済みチェックポイントのサイズを減らすことができます。 モデルの全ての重みに微小な変更を行うことによってモデルを微調整する代わりに、ほとんどの層を固定し、注意ブロック内の特定の一部の層のみをトレーニングします。さらに、これらの層のパラメータに触れず、二つの小さな行列の積を元の重みに加えることで、これらの層のパラメータを更新します。これらの小さな行列は微調整プロセス中に更新され、ディスクに保存されます。これにより、元のモデルのパラメータはすべて保存され、適応方法を使用してLoRAの重みを上にロードすることができます。 LoRA(Low Rank Adaptation)という名前は、先ほど言及した小さな行列から来ています。このメソッドについての詳細は、この記事または元の論文をご覧ください。 上記の図は、LoRAアダプタの一部として保存される二つの小さなオレンジ色の行列を示しています。後でこれらのLoRAアダプタをロードし、青いベースモデルと結合して黄色の微調整モデルを取得することができます。重要なことは、アダプタをアンロードすることも可能なので、いつでも元のベースモデルに戻すことができるということです。 言い換えると、LoRAアダプタは、必要に応じて追加および削除が可能なベースモデルのアドオンのようなものです。AとBの小さなランクのため、モデルサイズと比較して非常に軽量です。したがって、ロード時間は全体のベースモデルをロードするよりもはるかに高速です。 例えば、多くのLoRAアダプタのベースモデルとして広く使用されているStable Diffusion XL Base 1.0モデルリポジトリを見ると、そのサイズは約7 GBです。しかし、このモデルのような典型的なLoRAアダプタは、わずか24 MBのスペースしか使用しません!…
データエンジニアリング:初心者のためのフォーミュラ1にインスパイアされたガイド
私は強く信じていますある概念を説明する最も良い方法は、具体例を用いることですしかし、私の大学の教授の中には、「それを説明するために例が必要なら、それは理解していない証拠」と言う人もいました
なぜGPUはAIに適しているのか
GPUは人工知能の希少な地球の金属、さらには金そのものとも呼ばれています。それは、今日の生成的AI時代において基盤となる存在であるためです。それは3つの技術的理由と数多くのストーリーによって説明され、それぞれの理由には多くの側面がありますが、大まかに言えば次のようなものです。 GPUは並列処理を使用します。 GPUシステムはスーパーコンピュータの高さにまでスケールアップします。 AIのためのGPUソフトウェアスタックは幅広く深いです。 その結果、GPUはCPUよりも高速かつエネルギー効率が優れており、AIのトレーニングおよび推論においても優れたパフォーマンスを提供し、高速計算を使用するさまざまなアプリケーションにおいても利益をもたらします。 スタンフォード大学のヒューマンセンタードAIグループの最近のレポートによれば、GPUのパフォーマンスは「2003年以来約7000倍」向上し、価格性能比は「5600倍」増加していると報告されています。 2023年のレポートは、GPUのパフォーマンスと価格性能の急激な上昇を捉えています。 レポートはまた、AIの進展を測定し予測する独立系の研究グループであるエポックの分析も引用しています。 「GPUは、機械学習ワークロードを高速化するための主要なコンピューティングプラットフォームであり、過去5年間のほとんど(もしくはすべて)の最大のモデルがGPU上でトレーニングされています… それにより、AIの最近の進歩に重要な貢献をしています」とエポックはサイトで述べています。 また、米国政府のためにAI技術を評価した2020年の研究も同様の結論を導いています。 「製造および運用コストを含めた場合、最先端のAIチップは生産性と運用コストをリーディングノードCPUよりも1〜3桁高いと予想されます」と述べています。 「NVIDIAのGPUは、過去10年間にAI推論のパフォーマンスを1000倍向上させました」と同社の首席科学者であるビル・デーリー氏は、半導体およびシステムエンジニアの年次集会であるHot Chipsの基調講演で述べています。 ChatGPTがニュースを広める ChatGPTは、GPUがAIにとって優れたものであることを強力に示した例です。数千のNVIDIA GPUでトレーニングされ、実行される大規模な言語モデル(LLM)は、1億人以上の人々が利用する生成的AIサービスを提供しています。 その2018年のリリース以来、AIの業界標準ベンチマークであるMLPerfは、NVIDIA GPUのトレーニングおよび推論のリーディングパフォーマンスを詳細に示しています。 例えば、NVIDIA Grace Hopper Superchipsは最新の推論テストで圧倒的な成績を収めました。そのテスト以降にリリースされたNVIDIA TensorRT-LLM推論ソフトウェアは、パフォーマンスを最大8倍向上させ、エネルギー使用量と総所有コストを5倍以上削減します。実際、NVIDIA…
マイクロソフトとOpenAIのパートナーシップの裏側
「企業は、野心的かつ安全な方法で人工知能を発表するための手順を磨いてきたしかし、OpenAIの取締役会は彼らの慎重に計画されたすべてを台無しにした」
ディープシークは、ディープシーク-67Bモデルをオープンソース化しました:中国からの最新のChatGPTのライバル
中国のAIスタートアップ、DeepSeek AIは、DeepSeek LLMファミリーのデビューによって、大規模な言語モデル(LLM)の新時代を切り拓いています。 DeepSeek LLM 7B/67B BaseとDeepSeek LLM 7B/67B Chat からなるこれらのオープンソースモデルは、言語理解と多目的応用において大きな進歩を表しています。 DeepSeekのLLMの特色の一つは、67B BaseバージョンがLlama2 70B Baseに比べて優れた性能を発揮していることです。理論推論、コーディング、数学、中国語の理解などの分野で優れた能力を示します。 DeepSeek LLMのこの質的な飛躍は、幅広いアプリケーションでのその能力を示しています。特に注目すべきは、DeepSeek Chatが、類似のサイズのモデルをしのぐ、人間の評価基準の73.78%の合格率を達成したことです。また、調整なしでGSM8K数学データセットで84.1%をスコアリングするという卓越した力を示しました。 DeepSeek AIは、モデルの7億パラメータバージョンと67億パラメータバージョンを含む、ベースおよび専門用途のChatバリアントをオープンソース化することで、広範なAI研究と商業アプリケーションの促進を目指しています。 バイアスのない綿密なパフォーマンス評価を保証するために、DeepSeek AIは、ハンガリー国立高校試験やGoogleの指示に従った評価データセットなどの新しい問題集を設計しました。これらの評価は、モデルが以前に見たことのない試験やタスクを効果的に処理する能力を効果的に示しました。 スタートアップは、知的財産権を尊重しながら、多様性と独自性を高めることに焦点を当てた緻密なデータ収集とトレーニングプロセスについての洞察を提供しました。マルチステップのパイプラインでは、品質の高いテキスト、数学の式、コード、文学作品、さまざまなデータ型を選別し、有害な内容や重複したコンテンツを除外するためのフィルタを実装しました。 DeepSeekの言語モデルは、LLaMAに類似したアーキテクチャで設計され、厳格な事前トレーニングを受けました。7BモデルではMulti-Head…
このAIペーパーは、さまざまなタスクでChatGPTに追いついたり超えたりすると主張するオープンソースの大規模言語モデルの詳細なレビューを公開しています
昨年のChatGPTのリリースは、人工知能コミュニティを驚かせました。最新の大規模言語モデルであるGPTのトランスフォーマーアーキテクチャに基づいて開発されたChatGPTは、学術および商業アプリケーションの両方に大きな影響を与えています。このチャットボットは、リインフォースメントラーニングフロムヒューマンフィードバック(RLHF)の能力を利用し、監視付きのファインチューニングを通じて指示を調整することで、簡単に人間に応答し、コンテンツを生成し、クエリに答え、さまざまなタスクを実行することができます。 最近の研究では、シンガポール国立大学(NTU)、SalesForce AI、I2Rの研究者チームが、オープンソースの大規模言語モデル(LLM)の最新研究をまとめ、さまざまなコンテキストでChatGPTと同等またはそれ以上のパフォーマンスを発揮するモデルの完全な概要を提供するために広範な調査を行いました。ChatGPTのリリースと成功により、学界と産業界の両方で、この分野に専念したスタートアップから生まれた新しいLLMが豊富に見られるなど、LLM関連の追求が盛んになりました。 AnthropicのClaudeのようなクローズドソースのLLMは一般的にオープンソースの対抗モデルよりも優れているものの、OpenAIのGPTなどのモデルはより速く進化してきました。特定のタスクで同等またはそれ以上のパフォーマンスを達成するという主張が増えており、これによりクローズドソースモデルの歴史的な優位性が危うくなっています。 研究の観点から、新しいオープンソースのLLMの連続的なリリースとそれらの成功が、これらのモデルの強みと弱点を再評価することを余儀なくさせています。オープンソースの言語モデリングソフトウェアの進展は、言語モデルを組織の運営に取り入れたい企業にとって、ビジネスに関連する課題を提供しています。独自の代替品と同等またはそれ以上のパフォーマンスを得る可能性のおかげで、企業は独自の要件に最適なモデルを選択するためにより多くの選択肢を持つようになりました。 チームは、調査の貢献を特徴づけるために使用できる3つの主要なカテゴリを共有しました。 評価のまとめ:調査では、オープンソースのLLMがChatGPTとどのように異なるかについて客観的かつ包括的な視点を提供するために、さまざまな評価をまとめました。この総合は、オープンソースのLLMの利点と欠点を読者に包括的に理解させます。 モデルのシステマティックなレビュー:ChatGPTと同等またはそれ以上のパフォーマンスを発揮するオープンソースのLLMが、さまざまなタスクで調査されました。さらに、チームはリアルタイムで更新されるウェブページを共有しました。これにより、読者は最新の変更を確認できます。これは、オープンソースのLLMの開発のダイナミックな性質を反映しています。 助言と洞察:レビューや評価に加えて、調査はオープンソースのLLMの進化に影響を与えるパターンについての洞察力のある情報を提供しています。また、これらのモデルの潜在的な問題を探求し、オープンソースのLLMを教育するためのベストプラクティスについても議論しています。これらの結果は、企業セクターと学術コミュニティの両方に対して、既存のコンテキストと将来の可能性について詳細な視点を提供しました。
「Perplexity(パープレキシティ)が2つの新たなオンラインLLMモデルを発表:『pplx-7b-online』と『pplx-70b-online』」
パープレキシティ(Perplexity)は、革新的なAIスタートアップとして、情報検索システムを変革する解決策を発表しました。このローンチでは、革新的なLLM(Large Language Models)の2つ、pplx-7b-onlineとpplx-70b-onlineが公にアクセス可能なAPIを介して導入されました。これらのモデルは、Claude 2などの従来のオフラインLLMとは異なり、ライブインターネットデータを活用してリアルタイムで正確なクエリの応答を実現するため、最新のスポーツスコアなどの最新情報といった即座の情報に対する課題を克服しています。 パープレキシティのpplxオンラインモデルがAIの領域で差別化される要因は、APIを介して提供されるユニークなオファーにあります。Google Bard、ChatGPT、BingChatなどの既存のLLMは、オンラインブラウジングで進歩を遂げていますが、APIを介してこの機能を拡張しているものはありません。パープレキシティは、社内の検索インフラストラクチャにこの機能を帰属し、信頼性のある情報源を優先し、高度なランキングメカニズムを活用してリアルタイムに関連性の高い信頼性のある情報を提示するための幅広い優れたウェブサイトのリポジトリをカバーしています。これらのリアルタイムの「スニペット」はLLMに統合され、最新の情報を容易に反映しています。両モデルは、mistral-7bベースモデルとllama2-70bベースモデルに基づいて構築されています。 特筆すべきことに、Perplexity AIは、最先端のテクノロジーと統合するだけでなく、最適なパフォーマンスを引き出すためにこれらのモデルを細かく調整しています。この注意深いプロセスでは、社内データ請負業者によってキュレートされた多様なトップクラスのトレーニングセットを活用しています。この継続的な改善作業により、モデルは助けになり、事実性と新鮮さの面で優れた性能を発揮します。 これらのモデルの効果を検証するために、Perplexity AIは、助けになり、事実性、最新の情報性などの要素を評価する多様なプロンプトを使用して包括的な評価を実施しました。これらの評価では、オープンAIのgpt-3.5やメタAIのllama2-70bなどの主要なモデルとの比較を行い、全体的なパフォーマンスと特定の基準に焦点を当てました。 これらの評価の結果は印象的です。pplx-7b-onlineおよびpplx-70b-onlineは、鮮度、事実性、総合的な好みの面で、対応する他のモデルを常に上回っています。例えば、鮮度の基準では、pplx-7bとpplx-70bは、gpt-3.5とllama2-70bを上回る1100.6と1099.6の推定Eloスコアを獲得しました。 即座に、開発者はPerplexityのAPIにアクセスして、これらのモデルのユニークな機能を活用したアプリケーションを作成することができます。価格体系は利用料に基づいており、早期テスター向けの特別プランも用意されています。 このパイオニア的なリリースにより、PerplexityはAIによる情報検索システムに革新的な変革をもたらしています。pplx-7b-onlineとpplx-70b-onlineモデルがアクセス可能なAPIを介して導入され、既存のオフラインLLMの制約を解消し、正確かつ最新の事実性のある情報の提供で優れたパフォーマンスを発揮しています。 pplx-apiでの開始はこちら。 Perplexity Labsでオンラインモデルを無料で試す。 この記事は、PerplexityがオンラインLLMモデル2つを発表:「pplx-7b-online」と「pplx-70b-online」記事から取得されました。MarkTechPostから転載されました。
GenAIの製品:速く進んで失敗する
2022年の秋、私はクールなプロジェクトに取り組んでいましたはい、あなたは正解です-企業固有のデータでLLMsを調整していましたしかし、それにもかかわらず、ChatGPTがリリースされ、世界中で話題となりましたそして、何が…
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.