Learn more about Search Results プロバイダー - Page 4

GPUマシンの構築 vs GPUクラウドの利用

この記事では、コスト、パフォーマンス、運用、スケーラビリティなどの要素を分析し、深層学習や人工知能を用いたプロジェクトにおいて、オンプレミスのGPUマシンを構築することと、GPUクラウドサービスを使用することの利点とデメリットを検証しています

「OpenAIモデルに対するオープンソースの代替手段の探索」

序文 AIの領域では、11月はドラマチックな展開がありました。GPTストアやGPT-4-turboのローンチ、そしてOpenAIの騒動まで、まさに忙しい一ヶ月でした。しかし、ここで重要な問題が浮かび上がります:クローズドモデルとその背後にいる人々はどれだけ信頼できるのでしょうか?自分が実際に運用しているモデルが内部の企業ドラマに巻き込まれて動作停止するのは快適な体験とは言えません。これはオープンソースモデルでは起こらない問題です。展開するモデルには完全な管理権限があります。データとモデルの両方に対して主権を持っています。しかし、OSモデルをGPTと置き換えることは可能でしょうか?幸いなことに、既に多くのオープンソースモデルが、GPT-3.5モデル以上の性能を発揮しています。本記事では、オープンソースのLLM(Large Language Models)およびLMM(Large Multi-modal Models)の最高の代替品をいくつか紹介します。 学習目標 オープンソースの大規模言語モデルについての議論。 最新のオープンソース言語モデルとマルチモーダルモデルについての探求。 大規模言語モデルを量子化するための簡易な導入。 LLMをローカルおよびクラウド上で実行するためのツールやサービスについて学ぶ。 この記事は、データサイエンスブログマラソンの一環として公開されました。 オープンソースモデルとは何ですか モデルがオープンソースと呼ばれるのは、モデルの重みとアーキテクチャが自由に利用できる状態にあるからです。これらの重みは、例えばMeta’s Llamaのような大規模言語モデルの事前訓練パラメータです。これらは通常、ファインチューニングされていないベースモデルやバニラモデルです。誰でもこれらのモデルを使用し、カスタムデータでファインチューニングして下流のアクションを実行することができます。 しかし、それらはオープンなのでしょうか?データはどうなっているのでしょうか?多くの研究所は、著作権に関する懸念やデータの機密性の問題などの理由から、ベースモデルの訓練データを公開しません。これはまた、モデルのライセンスに関する部分にも関連しています。すべてのオープンソースモデルは、他のオープンソースソフトウェアと同様のライセンスが付属しています。Llama-1などの多くのベースモデルは非商用ライセンスとなっており、これらのモデルを利用して収益を上げることはできません。しかし、Mistral7BやZephyr7Bなどのモデルは、Apache-2.0やMITライセンスが付属しており、どこでも問題なく使用することができます。 オープンソースの代替品 Llamaのローンチ以来、オープンソースの領域ではOpenAIモデルに追いつこうとする競争が繰り広げられています。そしてその結果は今までにないものでした。GPT-3.5のローンチからわずか1年で、より少ないパラメータでGPT-3.5と同等またはそれ以上のパフォーマンスを発揮するモデルが登場しました。しかし、GPT-4は依然として理性や数学からコード生成までの一般的なタスクには最も優れたモデルです。オープンソースモデルのイノベーションと資金調達のペースを見ると、GPT-4のパフォーマンスに近づくモデルが間もなく登場するでしょう。とりあえず、これらのモデルの素晴らしいオープンソースの代替品について話しましょう。 Meta’s Llama 2 Metaは今年7月にLlama-2という彼らの最高のモデルをリリースし、その印象的な能力により一瞬で人気を集めました。MetaはLlama-7b、Llama-13b、Llama-34b、Llama-70bの4つの異なるパラメータサイズのLlama-2モデルをリリースしました。これらのモデルは、それぞれのカテゴリにおいて他のオープンモデルを上回る性能を発揮しました。しかし、現在ではmistral-7bやZephyr-7bのような複数のモデルが、多くのベンチマークで小さなLlamaモデルを上回る性能を発揮しています。Llama-2 70bはまだそのカテゴリーで最高のモデルの一つであり、要約や機械翻訳などのタスクにおいてGPT-4の代替モデルとして価値があります。 Llama-2はGPT-3.5よりも多くのベンチマークで優れたパフォーマンスを発揮し、GPT-4に迫ることもできました。以下のグラフは、AnyscaleによるLlamaとGPTモデルのパフォーマンス比較です。…

AIのプッシュとプルを克服する:AIを活用するためのITチームからの教訓

人工知能(AI)はまだ幼いですが、既にIT業界やチーム内の人々のやり方に大きな影響を与えていますしかし、テックプロフェッショナルはしばしば2つの異なる方向に引っ張られることがあります一方で、テックプロフェッショナルはAIを活用したソリューションを迅速に実装する必要があると感じており、増加した利益を享受するための行動が求められます...

アプリケーションの近代化における生成AIの活用

「生成AIは、極度の自動化の時代において、アプリケーションの近代化プログラムを加速させるための強力なエンエーブラーとなっています」

Amazon Lexの新しい生成AI機能で、セルフサービスアシスタントを向上させましょう

この投稿では、生成AIが会話型AI業界を変えて、新しい顧客とボットビルダーの体験を提供し、これらの進歩を活用するアマゾンレックスの新機能についてお話しします会話型AIの需要がさらに高まる中、開発者は人間のような対話体験を持つチャットボットを向上させる方法を求めています

医療画像AIがより簡単になりました:NVIDIAがMONAIをホステッドクラウドサービスとして提供

本日、NVIDIAは医療画像AIのためのクラウドサービスを立ち上げました。これにより、完全に管理され、クラウドベースのAPIを通じてグランドトゥルースデータの作成と専門的なAIモデルのトレーニングをスムーズ化し、加速させることができます。 NVIDIA MONAIクラウドAPIは、この週にシカゴで開催される北米放射線学会の年次総会(RSNA)で発表され、開発者とプラットフォームプロバイダが事前にトレーニングされた基礎モデルを使用し、企業向けのAIワークフローを統合するための迅速なパスを提供します。これらのAPIは、NVIDIAとキングズカレッジロンドンによって設立されたオープンソースのMONAIプロジェクトに基づいて構築されています。 医療画像は医療分野全体で重要な役割を果たしており、医療データの約90%を占めています。これは放射線科医や臨床医がスクリーニング、診断、介入を行うために使用されるほか、バイオファーマの研究者が臨床試験患者が新薬にどのように反応するかを評価するために使用され、医療機器メーカーはリアルタイムの意思決定支援を提供します。 これらの領域における作業の規模は、医療画像専用のAIファクトリーを必要とします。これはエンタープライズグレードのプラットフォームであり、大規模なデータ管理を提供し、グランドトゥルースのアノテーションを作成し、モデルの開発を加速し、シームレスなAIアプリケーションの展開を確立します。 NVIDIA MONAIクラウドAPIを使用することで、ソリューションプロバイダは医療画像プラットフォームにAIをより簡単に統合することができます。これにより、放射線科医、研究者、臨床試験チームがドメインに特化したAIファクトリーを構築するための高速ツールを提供することができます。これらのAPIは、NVIDIA DGX Cloud AIスーパーコンピューティングサービスを通じて早期アクセスで利用可能です。 NVIDIA MONAIクラウドAPIは、AI開発のためのエンドツーエンドワークフローをサポートする主要な医療画像データおよびAIプラットフォームであるFlywheelに統合されています。RedBrick AIなどの医療画像アノテーション企業の開発者やDataikuなどの機械学習オペレーション(MLOps)プラットフォームプロバイダは、NVIDIA MONAIクラウドAPIを自社の提供物に統合する予定です。 医療画像のための準備完了のアノテーションとトレーニング 効率的かつコスト効果の高いAIソリューションを構築するには、ソフトウェアのためのフルスタック最適化、スケーラブルなマルチノードシステム、最新の研究など、堅牢でドメインに特化した開発基盤が必要です。また、高品質なグランドトゥルースデータも必要ですが、特に3D医療画像では専門知識が高度に必要なアノテーションのため、煩雑で時間がかかる場合があります。 NVIDIA MONAIクラウドAPIには、VISTA-3D(Vision Imaging Segmentation and Annotation)の基礎モデルによるインタラクティブなアノテーション機能が搭載されています。これにより、ユーザーのフィードバックと新しいデータに基づいて、AIモデルのパフォーマンスが向上します。 VISTA-3Dは、さまざまな疾患と体の部位にわたる4,000人以上の患者の3D CTスキャンからアノテーション付き画像のデータセットでトレーニングされており、医療画像解析のための3Dセグメンテーションマスクの作成を加速します。そして、継続的な学習により、AIモデルのアノテーション品質が時間とともに向上します。…

現代のサイバーセキュリティの脅威に対処する効果的な方法

「サイバーセキュリティの脅威は技術の進歩に伴って増加していますこの記事では一般的な脅威の扱い方をカバーします」

「Rcloneを使用したクラウドベースのデータストレージの管理」

企業がクラウドベースのストレージソリューションにますます依存するにつれて、ビッグデータを効果的に管理するために適切なツールと技術を持つことが不可欠です

アマゾンEC2 Deep Dive:ハードウェアインサイトを活用したワークロードの最適化

あなたのアプリケーションのニーズに合った適切な基盤ハードウェアを選ぶことで、クラウドリソースの効率が向上します本記事では、このアプローチを取る方法について説明します

カスタムレンズを使用してウェルアーキテクチュアIDPソリューションを構築する – パート2:セキュリティ

「AWSで本番用のソリューションを構築するには、リソース、時間、顧客の期待、およびビジネスの結果との間でトレードオフを繰り返す必要がありますAWS Well-Architectedフレームワークは、AWS上でワークロードを構築する際に行う決定の利点とリスクを理解するのに役立ちますフレームワークを使用することで、現在の運用レベルと設計に関する推奨事項を学ぶことができます...」

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us