Search Results ダウンロード

「PDFドキュメントを使用したオブジェクト検出のためのカスタムDetectron2モデルの訓練と展開（パート1：訓練）」

「私は半年ほど、PDF文書を機械読み取り可能にすることで、少なくともセクションを特定するテキストである見出し/タイトルが読み取れるようにするビジネスケースを解決しようと取り組んできました」

注釈の習得：LabelImgとのシームレスなDetectron統合

イントロダクションコンピュータビジョンの大局において、画像のラベリングや写真の注釈付けは困難でありました。私たちの調査は、LabelImgとDetectronのチームワークに深く入り込んでおり、正確な注釈付けと効率的なモデル構築を組み合わせた強力なデュオです。簡単で正確なLabelImgは、注意深い注釈付けでリーダーシップを発揮し、明確なオブジェクト検出のための堅固な基盤を築きます。 LabelImgを試行し、境界ボックスの描画についてのスキルを向上させると、Detectronにシームレスに移行します。この堅牢なフレームワークは、マークされたデータを整理し、高度なモデルのトレーニングに役立ちます。LabelImgとDetectronは、初心者からエキスパートまで、誰にでも簡単にオブジェクト検出を可能にします。マークされた各画像が視覚情報のフルパワーを解き放つのをお手伝いいたします。学習目標 LabelImgの使い方を学ぶ。環境のセットアップとLabelImgのインストール。 LabelImgの理解と機能。 VOCまたはPascalデータをCOCO形式に変換してオブジェクト検出する。この記事はData Science Blogathonの一環として発表されました。フローチャート環境のセットアップ 1. 仮想環境の作成： conda create -p ./venv python=3.8 -y このコマンドはPythonバージョン3.8を使用して、「venv」という名前の仮想環境を作成します。 2. 仮想環境のアクティブ化：…

「OpenAIモデルに対するオープンソースの代替手段の探索」

序文 AIの領域では、11月はドラマチックな展開がありました。GPTストアやGPT-4-turboのローンチ、そしてOpenAIの騒動まで、まさに忙しい一ヶ月でした。しかし、ここで重要な問題が浮かび上がります：クローズドモデルとその背後にいる人々はどれだけ信頼できるのでしょうか？自分が実際に運用しているモデルが内部の企業ドラマに巻き込まれて動作停止するのは快適な体験とは言えません。これはオープンソースモデルでは起こらない問題です。展開するモデルには完全な管理権限があります。データとモデルの両方に対して主権を持っています。しかし、OSモデルをGPTと置き換えることは可能でしょうか？幸いなことに、既に多くのオープンソースモデルが、GPT-3.5モデル以上の性能を発揮しています。本記事では、オープンソースのLLM（Large Language Models）およびLMM（Large Multi-modal Models）の最高の代替品をいくつか紹介します。学習目標オープンソースの大規模言語モデルについての議論。最新のオープンソース言語モデルとマルチモーダルモデルについての探求。大規模言語モデルを量子化するための簡易な導入。 LLMをローカルおよびクラウド上で実行するためのツールやサービスについて学ぶ。この記事は、データサイエンスブログマラソンの一環として公開されました。オープンソースモデルとは何ですかモデルがオープンソースと呼ばれるのは、モデルの重みとアーキテクチャが自由に利用できる状態にあるからです。これらの重みは、例えばMeta’s Llamaのような大規模言語モデルの事前訓練パラメータです。これらは通常、ファインチューニングされていないベースモデルやバニラモデルです。誰でもこれらのモデルを使用し、カスタムデータでファインチューニングして下流のアクションを実行することができます。しかし、それらはオープンなのでしょうか？データはどうなっているのでしょうか？多くの研究所は、著作権に関する懸念やデータの機密性の問題などの理由から、ベースモデルの訓練データを公開しません。これはまた、モデルのライセンスに関する部分にも関連しています。すべてのオープンソースモデルは、他のオープンソースソフトウェアと同様のライセンスが付属しています。Llama-1などの多くのベースモデルは非商用ライセンスとなっており、これらのモデルを利用して収益を上げることはできません。しかし、Mistral7BやZephyr7Bなどのモデルは、Apache-2.0やMITライセンスが付属しており、どこでも問題なく使用することができます。オープンソースの代替品 Llamaのローンチ以来、オープンソースの領域ではOpenAIモデルに追いつこうとする競争が繰り広げられています。そしてその結果は今までにないものでした。GPT-3.5のローンチからわずか1年で、より少ないパラメータでGPT-3.5と同等またはそれ以上のパフォーマンスを発揮するモデルが登場しました。しかし、GPT-4は依然として理性や数学からコード生成までの一般的なタスクには最も優れたモデルです。オープンソースモデルのイノベーションと資金調達のペースを見ると、GPT-4のパフォーマンスに近づくモデルが間もなく登場するでしょう。とりあえず、これらのモデルの素晴らしいオープンソースの代替品について話しましょう。 Meta’s Llama 2 Metaは今年7月にLlama-2という彼らの最高のモデルをリリースし、その印象的な能力により一瞬で人気を集めました。MetaはLlama-7b、Llama-13b、Llama-34b、Llama-70bの4つの異なるパラメータサイズのLlama-2モデルをリリースしました。これらのモデルは、それぞれのカテゴリにおいて他のオープンモデルを上回る性能を発揮しました。しかし、現在ではmistral-7bやZephyr-7bのような複数のモデルが、多くのベンチマークで小さなLlamaモデルを上回る性能を発揮しています。Llama-2 70bはまだそのカテゴリーで最高のモデルの一つであり、要約や機械翻訳などのタスクにおいてGPT-4の代替モデルとして価値があります。 Llama-2はGPT-3.5よりも多くのベンチマークで優れたパフォーマンスを発揮し、GPT-4に迫ることもできました。以下のグラフは、AnyscaleによるLlamaとGPTモデルのパフォーマンス比較です。…

3Dアーティストのヌルハン・イスマイルは、Adobe After EffectsとBlenderを使用して、イソメトリックな革新を「NVIDIA Studio」にもたらす

編集者の注：この投稿は、弊社の週刊In the NVIDIA Studioシリーズの一部で、注目されたアーティストを称え、クリエイティブなヒントやトリックを提供し、NVIDIA Studioテクノロジーがクリエイティブなワークフローを向上させる方法を示しています。今週の才能あるIn the NVIDIA Studioアーティスト、Nourhan Ismailさんは、文字通りのNVIDIAスタジオを作りました。彼女の作品「Creator by Day, Gamer by Night」は、イスマイールさんが知られる等角アートスタイルと印象的なグラフィカルな忠実さで作られており、鮮やかな色彩と遊び心のあるディテールに満ちています。また、彼女の「仕事を一生懸命に、遊びを一生懸命に」という3Dアーティスト、インテリアデザイナー、ゲームレベルデザイナーとしての考えを捉えています。同じアートスタイルは、IsmailさんがリードするNVIDIA Studio Sessions YouTubeミニシリーズでも紹介されており、入稿から最終レンダリングまでの手順についてのステップバイステップのチュートリアルを提供しています。 facial Animations Made Easier…

「NVIDIA BioNeMoがAWS上での薬剤探索のための生成型AIを可能にする」

主要な製薬会社やテクバイオ企業の研究者や開発者は、Amazon Web Servicesを通じてNVIDIA Claraソフトウェアとサービスを簡単に展開できるようになりました。詳細はこちらをご覧ください。本日のAWS re:Inventで発表されたこの取り組みにより、AWSクラウドリソースを使用しているヘルスケアおよびライフサイエンスの開発者は、NVIDIAの加速オファリングを柔軟に統合することができるようになります。これにはNVIDIA BioNeMo（創成AIプラットフォーム）も含まれており、AWS上のNVIDIA DGX Cloudに追加され、高性能コンピューティングのためのAWS ParallelClusterクラスタ管理ツールとAmazon SageMakerマシンラーニングサービスを介して現在利用可能です。北薬やライフサイエンス企業の数千社がAWSを利用しています。彼らは今やBioNeMoにアクセスして、専有データを使用してデジタル生物学の基礎モデルを構築またはカスタマイズし、NVIDIA GPUアクセラレートクラウドサーバーを使用してモデルのトレーニングとデプロイをスケールアップすることが可能です。 Alchemab Therapeutics、Basecamp Research、Character Biosciences、Evozyne、Etcembly、LabGeniusなどのテクバイオイノベーターは、既にBioNeMoを使用して創成AIによる医薬品の探索と開発を行っています。このコラボレーションにより、彼らはバイオモレキュラーデータ上でトレーニングされた創成AIモデルを開発するためにクラウドコンピューティングリソースを迅速にスケールアップするためのより多くの方法を得ることができます。この発表により、NVIDIAの既存のヘルスケアに特化したオファリングがAWS上で利用可能になります。それには、医療画像処理のためのNVIDIA MONAIおよびジェノミクスの加速のためのNVIDIA Parabricksも含まれています。 AWSでの新機能：NVIDIA BioNeMoが創成AIを推進する BioNeMoは、デジタル生物学のためのドメイン固有のフレームワークであり、事前学習済みの大規模言語モデル（LLM）、データローダー、最適化されたトレーニングレシピを含んでいます。これにより、ターゲットの同定、タンパク質構造の予測、薬剤候補のスクリーニングを加速することで、コンピュータ支援の薬剤探索を推進することができます。薬剤探索チームは、BioNeMoを使用して専有データを活用し、クラウドベースの高性能コンピューティングクラスター上でモデルを構築または最適化することができます。…

このAIニュースレターはあなたが必要なすべてです＃75

今週は、OpenAIのドラマが終わり、Sam AltmanとGreg BrockmanがOpenAIに復帰し、2人の新しい取締役が任命されました（既存の1人とともに…

GPT-4の進化：Python Plotlyダッシュボードの簡単な作成方法

数ヶ月前、私はPythonのplotlyダッシュボード作成のためのGPT-4のプロンプト方法に関する一連の（まずまず成功した）記事を書きました最近、GPT-4はデータの可視化を分析して表示する能力を大幅に向上させましたそれは今や簡単にマルチビジュアルなPythonのplotlyダッシュボードの作成に対応できるのでしょうか？読んで確かめましょう！

「BeautifulSoupを使ったWebスクレイピングのマスタリング」

これはWebスクレイピングを学びたい人にとって素晴らしいガイドですBeautifulSoupを使ったWebスクレイピングの基礎を理解し、どのように使うかを説明しています

‘製品およびエンジニアリングリーダーのための実践的なGenAI’

「もし普段から運転することがあるなら、自動車のフードには気にすることなく綿が詰まっているかもしれませんしかし、もしもあなたがより良い車を作る責任を持つ設計や製造の一環であるならば…」

新しいAmazon SageMakerコンテナでLLMの推論パフォーマンスを強化する

今日、Amazon SageMakerは、大規模モデル推論（LMI）Deep Learning Containers(DLCs)の新バージョン（0.25.0）をリリースし、NVIDIAのTensorRT-LLMライブラリのサポートを追加しましたこれらのアップグレードにより、SageMaker上で最先端のツールを簡単に使用して大規模言語モデル（LLMs）を最適化し、価格パフォーマンスの利点を得ることができます - Amazon SageMaker LMI TensorRT-LLM DLCは、レイテンシを33%削減します[...]

Learn more about Search Results ダウンロード - Page 7