Search Results 使用方法

「PythonのSet union() – 5分で完全ガイド」

「Pythonプログラマーには、2つのセットを結合するためのいくつかの方法がありますこのブログ記事では、セットのunion()メソッドを紹介し、その使用方法のいくつかの例も見ていきますさらに、set union()の利点についても話し合い、Pythonで人気のあるツールである理由についても見ていきます...」

「ビルドの学び方 — Towards AI コミュニティニュースレター第2号」

「最近の数日間、OpenAIのドラマを追っていないと見逃しているよ信じられないことが起こったんだ多くの従業員がOpenAIの理事会に宛てて手紙に署名し送ったんだよ…」

「AWS reInvent 2023での生成的AIとMLのガイド」

はい、AWS reInventの季節がやってきましたいつものように、場所はラスベガスです！カレンダーに印をつけ、ホテルを予約し、さらには航空券も購入済みですねさて、それでは第12回reInventで開催されるジェネレーティブAIと機械学習（ML）のセッションに参加するためのガイダンスが必要ですジェネレーティブAIは以前のイベントでも登場していましたが、今年はさらなる進化を遂げます基調講演中にはいくつかの注目発表がありますし、私たちのトラックのほとんどのセッションでもジェネレーティブAIを導入していますそのため、私たちのトラックを「ジェネレーティブAIとML」と呼ぶことができますこの記事では、トラックの構成とおすすめのセッションを紹介しますジェネレーティブAIに焦点を当てたトラックではありますが、他のトラックにも関連セッションがありますので、セッションカタログを閲覧する際には「ジェネレーティブAI」のタグを使用してください

マイクロソフトリサーチは、Florence-2という新しいビジョン基盤モデルを導入しましたこれは、さまざまなコンピュータビジョンやビジョン言語のタスクに対応する統一されたプロンプトベースの表現を持っています

人工一般知能（AGI）システムでは、タスクに関係なく利点を提供する事前トレーニング可能な適応的表現の使用に向けた noticeable な傾向が見られました。自然言語処理（NLP）は、この傾向の良い例です。洗練されたモデルは、明快な指示で複数のドメインとタスクをカバーする包括的な知識を持つ柔軟性を示します。NLPの人気は、コンピュータビジョンにおいて補完的な戦略を促しています。特徴やマスキングされた輪郭、オブジェクト配置など、コンピュータビジョンでは特徴的な視覚データの処理が必要です。コンピュータビジョンにおいて普遍的な表現を実現するためには、図1に示されるように、2次元に配置されたさまざまな厳しい課題を上手に処理する必要があります。図1 空間の階層性：モデルは、細部のピクセル情報と画像レベルのアイデアを理解することで異なるサイズの空間情報を認識する必要があります。図に示したビジョンにおける複雑な空間の階層をサポートするためには、モデルはさまざまな粒度を管理できる能力を持たなければなりません。意味的な粒度：コンピュータビジョンでは、普遍的な表現はさまざまな意味的な粒度をカバーする必要があります。抽象的なタイトルからより詳細な説明へのパラダイムの変化により、さまざまな使用方法に対する柔軟な理解が提供されます。この追求は、特異性と重要な挑戦に特徴付けられます。主要な障害は、より多くのデータの必要性であり、空間の階層性と意味的な粒度の複雑なニュアンスを捉える基盤モデルの開発を妨げます。ImageNet、COCO、Flickr30k Entitiesなどの既存のデータセットは、特殊なアプリケーション向けに広範に人間によってラベル付けされています。この制約に対処するためには、より大規模なスケールで各画像の詳細な注釈を生成することが不可欠です。また、コンピュータビジョンで空間の階層性と意味的な粒度をシームレスに統合するモデルが存在しません。タスク固有のデザインにより、従来のモデルは、意味的セグメンテーション、オブジェクト識別、画像キャプションなどのタスクで優れたパフォーマンスを発揮します。ただし、異なるビジョンタスクに対してタスク非依存的な方法で適応できる完全で統一的なモデルを作成することは、重要です。統一された事前トレーニングとネットワークデザインを通じて、このモデルは、コンピュータビジョンにおける空間、時間、多モーダルの特徴の統合を先駆的に行っています。最初の進化的イテレーションは、ノイズのあるテキスト-イメージのペアリングでの事前トレーニングとカスタマイズされたアダプタを使用したタスク固有の微調整を通じて転送学習に優れています。ただし、大規模なタスク固有のデータセットとアダプタへの依存は、上記の2つの主要な問題に取り組む際にギャップを生じさせる原因となります。この研究では、Azureの研究者が、豊富なビジュアル注釈を使用して獲得された普遍的なバックボーンを提供しています。これにより、不完全かつ包括的なデータと均一なアーキテクチャの不足を成功裏に解決できる、様々なビジョンタスクに対するプロンプトベースの統一された表現が実現されます。多タスク学習には、大規模で高品質な注釈付きデータが必要です。時間のかかる人間の注釈に頼らずに、彼らのデータエンジンは、\fld という広範なビジュアルデータセットを作成します。このエンジンには2つの効果的な処理モジュールがあります。第1のモジュールでは、特化モデルを使用して写真に共同でおよび自律的に注釈を付けることにより、従来の単一および手動の注釈戦略から脱却します。集団の知恵理論に類似して、多くのモデルが協力して一致を作り出し、より公平で信頼性のある画像解釈を実現します。習得された基本モデルを使用して、第2のモジュールはこれらの自動注釈を反復的に洗練し、フィルタリングします。彼らのモデルは、この大規模なデータセットを活用して、シーケンス対シーケンス（seq2seq）アーキテクチャを使用して、イメージエンコーダとマルチモダリティエンコーダ‐デコーダを統合しています。このアーキテクチャは、タスク固有のアーキテクチャの調整を必要とせずに、さまざまなビジョンタスクをサポートします。これは、NLPコミュニティの柔軟なモデル作成と統一された基盤の目標と一致しています。データセット内のすべての注釈は、一貫してテキストの出力に標準化されます。これにより、目標と同じ損失関数を使用して単一の多タスク学習戦略を一貫して最適化することが可能になります。その結果、統一されたパラメータを持つ単一のモデルの制御下で、オブジェクト認識、キャプション付け、およびグラウンディングを含むさまざまな機能を処理できる柔軟なビジョン基盤モデル、またはモデルが作成されます。大規模な言語モデル（LLM）が使用する方法と一致して、テキストをプロンプトとして活用することにより、タスクを活性化させます。彼らの方法は、一般的な表現を達成し、多くの視覚的タスクで広範な利用が可能です。主な見つかりとしては以下のとおりです：モデルは柔軟なビジョン基礎モデルであり、RefCOCOでの参照表現の理解、Flick30kでの視覚的根拠、およびCOCOでのキャプション作成などのタスクにおいて、新しい最先端のゼロショット性能を提供します。モデルは小さなサイズにもかかわらず、公開された人間によるアノテーションデータを使用して微調整した後、より専門化されたモデルと競合します。特に、改良されたモデルはRefCOCOで新しいベンチマークの最先端スコアを設定しています。事前に学習されたバックボーンは、下流のタスクであるCOCOオブジェクト検出、インスタンスセグメンテーション、およびADE20K意味セグメンテーションにおいて、教師付きおよび自己教師付きモデルを上回ります。彼らのモデルは、Mask-RCNN、DINO、およびUperNetフレームワークを使用しており、COCOおよびADE20Kデータセットに対してそれぞれ6.9、5.5、および5.9ポイントの大幅な向上をもたらし、またImageNetでの事前学習モデルのトレーニング効率を4倍にしています。

「Amazon Bedrock と Amazon Location Service を使用したジオスペーシャル生成AI」

今日、ジオスペーシャルのワークフローは、通常、データの読み込み、変換、そしてマップ、テキスト、またはチャートなどの視覚的インサイトの生成から構成されます生成AIは、これらのタスクを自律エージェントを介して自動化することができますこの投稿では、Amazon Bedrockの基本モデルを使用して、ジオスペーシャルタスクを完了するためにエージェントにパワーを与える方法について説明しますこれらのエージェントはさまざまなタスクを実行することができます[...]

「Synthesiaレビュー：2023年11月の＃1 AIビデオジェネレーター？」

「この詳細なSynthesiaレビューでSynthesiaの真実を発見してください本当に＃1のAIビデオジェネレーターなのでしょうか？」

Synthesia

大規模な言語モデルをマスターするための包括的な資源リスト

大規模言語モデル（LLM）は、さまざまなアプリケーションの重要な一部となりましたこの記事では、LLMの世界に飛び込みたいと思う人々のための豊富な情報源のリストを提供しています

language models

「セルフサービスデータ分析はニーズの階層化です」

90年代を振り返ってみると、ビジネスオブジェクトやコグノスなどのセルフサービス型ビジネスインテリジェンス（BI）ツールが最初に導入されたことを思い出しますまったくもって熱心なソフトウェアエンジニアのように、私も...

簡単なアプリの統合に最適な安定した拡散APIのトップ5

イントロダクション APIは人工知能の時代における解決策であり、AIモデルをソフトウェアやアプリケーションに統合する際の高い計算要件を管理する企業にとって重要な課題です。その解決策として、Application Programming Interfaces（API）が存在します。APIはメンテナンスの手間を省き、ビジネスロジックとユーザーエクスペリエンスに集中できるようにしてくれます。つまり、誰でもこれらのAPIを活用してアプリを構築し、商品化できます。本記事では、画像生成に焦点を当てた一連のGenerative AIモデルであるStable Diffusion APIsについて詳しく説明します。まずは非常に効率的かつ効果的なオプションであるSegmind APIについて見ていきましょう。これらのAPIは、開発者、デザイナー、クリエイターが視覚コンテンツの生成に取り組む方法を革新しました。トップ5のStable Diffusion APIsを探求し、その特徴、使用用途、価格などをハイライトします。学習目標 Stable Diffusionモデルに関する洞察を得る。 Stable Diffusionモデルの基礎を理解する。それには、その応用も含まれます。現代のソフトウェア開発におけるAPIの理解。 APIがソフトウェアおよびアプリケーションの開発を簡素化する際に果たす重要な役割の探求。この記事はData Science Blogathonの一環として公開されました。 Stable Diffusionモデルの理解 Stable…

「Amazon Textractの新しいレイアウト機能は、一般的な目的と生成型のAIドキュメント処理タスクに効率をもたらします」

Amazon Textractは、任意のドキュメントや画像から自動的にテキスト、手書き、データを抽出する機械学習（ML）サービスですAnalyzeDocument Layoutは、ドキュメントから段落、タイトル、字幕、ヘッダー、フッターなどのレイアウト要素を自動的に抽出する新機能ですこのレイアウト機能は、Amazon Textractの単語と行の検出を拡張します

Learn more about Search Results 使用方法 - Page 9