Search Results A

シンガポールがAIワークフォースを3倍に増やす予定

シンガポールは、人工知能の分野に目を向けています。国家AI戦略（NAIS）2.0の発表により、この都市国家は次の3〜5年でAIの労働力を15,000人にまで増やす計画です。この野心的なイニシアチブは、シンガポールの技術的な風景だけでなく、社会の構造も再構築するものとなるでしょう。見習いによる人材育成才能のプールを強化するために、シンガポール政府はすでに300人以上の卒業生を輩出した見習いプログラムを改革することを目指しています。多様な産業のAIプロダクト開発チームとの強化された協力により、参加者には実世界の経験が提供されます。この多角的なアプローチは、クリエイターとユーザーのギャップを埋めるダイナミックなエコシステムを育成することを目指しています。戦略的なAIの統合 NAIS 2.0では、すべての企業でのAIの導入を奨励することに重要な重点を置いています。産業変革マップと職業変革マップによってガイドされるターゲットトレーニングプログラムは、労働力のスキルアップに不可欠です。その目標は、製造業、金融サービス、輸送、物流、バイオ医学などのセクターにAIをシームレスに統合することです。未開のAI領域副首相のローレンス・ウォンは、発表会で変革の道程について強調しました。人間の認知能力に似た機械によって特徴づけられるAIの進化する風景は、包括的な国家戦略を要求しています。フラッグシッププロジェクトからシステムアプローチへのシフトにより、AIは単なる機会ではなく、シンガポールの未来にとって必要不可欠なものとして位置付けられています。倫理的なAIガバナンス AIの倫理的な影響についての懸念に対処するため、シンガポールの規制アプローチはイノベーションの促進とセーフガードの実施の微妙なバランスを求めています。更新されたモデルガバナンスフレームワークとAI Verifyツールキットは、責任ある開発を確保することを目指しています。ウォン副首相は、定期的なレビューと調整が行われる「目的に適した」規制環境の必要性を強調しました。私たちの意見シンガポールのグローバルリーダーシップへのコミットメントは、変革的な技術の課題と機会に対する積極的なアプローチを反映しています。この国がさまざまな領域で優れた研究、基盤整備、国際パートナーシップを追求することは、先例を打ち立てています。シンガポールカンファレンスの開催はその意義があり、全世界での協力とアイデア交換の場を提供します。シンガポールの国家AI戦略2.0は、単なるアップデート以上のものです。この国はAIの力をどのように認識し活用するかを再定義しています。この未開の領域に進む中、シンガポールは世界に招待し、関与することを求めています。この変革的な旅は、グローバルなAIの未来を形作っています。

Google AIとテルアビブ大学の研究者は、テキストから画像への拡散モデルと専門のレンズジオメトリを組み合わせた人工知能フレームワークを提案しています画像のレンダリングに関して、これは画期的なものです

画像生成の最近の進歩は、大規模な拡散モデルを利用した、テキストと画像データのペアで訓練されたもので、多様な条件付け手法を取り入れ、ビジュアル制御を向上させています。これらの手法は、明示的なモデルの条件付けから、新しいモダリティのための事前学習済みアーキテクチャの変更まで様々です。深度などの抽出された画像特徴を使用してテキストによる条件付けモデルを微調整することで、画像の再構築が可能になります。以前の研究者は、オリジナルの解像度情報を利用したGANsフレームワークを紹介し、多解像度および形状一貫性のある画像生成を実現しました。 Google Researchとテルアビブ大学の研究者は、AIフレームワーク（AnyLens）を提案し、専用のレンズジオメトリとテキストから画像への拡散モデルを統合して画像レンダリングを実現しています。この統合により、レンダリングジオメトリの正確な制御が可能になり、単一の拡散モデルを使用して魚眼、パノラマビュー、および球面テクスチャなどの様々な視覚効果の生成が容易になります。本研究では、テキストから画像への拡散モデルに多様な光学制御を組み込むための新しい手法を提案しています。この手法により、モデルはローカルなレンズジオメトリに基づいて条件付けされ、リアルな画像生成のための複雑な光学効果の再現能力が向上します。従来のキャンバス変換を超えて、手法はピクセルごとの座標条件付けを介してほぼ任意のグリッド変形を可能にします。このイノベーションは、パノラマシーンの生成や球体のテクスチャリングを含むさまざまなアプリケーションをサポートします。計量テンソル条件付けを用いた幾何学的に感知的な画像生成フレームワークを導入して、画像生成の制御と操作の可能性を拡大します。本研究は、ピクセルごとの座標条件付けを通じてテキストから画像への拡散モデルに特定のレンズジオメトリを統合するフレームワークを紹介しています。この手法は、ランダムなワーピングフィールドを使用して画像を変形させたデータによって事前学習された潜在的な拡散モデルを微調整します。自己注意層のトークン再重み付けが採用されています。この方法は曲率特性の操作を可能にし、魚眼やパノラマビューなどのさまざまな効果をもたらします。画像生成において固定された解像度を超え、計量テンソル条件付けを組み込むことで制御が向上します。このフレームワークは、大規模な画像生成や拡散モデルにおける自己注意スケールの調整といった課題に取り組むことで、画像操作の可能性を拡張します。このフレームワークは、特定のレンズジオメトリを持つテキストから画像への拡散モデルを正確に統合し、魚眼、パノラマビュー、球面テクスチャなどのさまざまな視覚効果を単一のモデルで実現します。曲率特性とレンダリングジオメトリに対する正確な制御が提供され、リアルで微妙な画像生成が実現されます。大規模なテキスト注釈データセットとピクセルごとのワーピングフィールドで訓練されたこの手法は、目標のジオメトリに密接に合わせ、細やかな歪みのない結果の任意の変形画像を生成することを容易にします。また、球面パノラマをリアルな比率と最小限のアーティファクトで作成することも可能になります。まとめとして、画像レンダリングにおけるさまざまなレンズジオメトリの組み込みを提供する新しく導入されたフレームワークは、曲率特性と視覚効果に対する制御を向上させます。ピクセルごとの座標および計量条件付けを通じて、レンダリングジオメトリの操作を容易にし、高度なリアルな画像およびジオメトリ操作を可能にします。このフレームワークは、高品質な画像を作成するための貴重なツールとして、イメージ合成における創造性と制御を促進します。今後の研究では、多様な画像生成を向上させるために、高度な条件付け技術を探求することにより、手法の制限を克服することが求められます。研究者たちは、専門的なレンズによって異なるシーンを捉える結果に近い結果を得るために手法を拡張することを提案しています。より高度な条件付け技術の使用についても言及し、画像生成の向上と機能の拡張を期待しています。

このQualcomm AI ResearchのAIペーパーは、EDGIを公開しました：先進的なモデルベースの強化学習と効率的な計画のための画期的な不変拡散器

あらゆるところに対称性があります。物理学の普遍的な原則は、空間と時間の両方において成り立ちます。空間座標が変換、回転、時間的にシフトされると、対称性が現れます。さらに、システムは、いくつかの似ているまたは同等のアイテムが番号でラベル付けされた場合、そのラベルの置換に関して対称です。具現化エージェントはこの構造に直面し、多くの日常的なロボット活動が時間的、空間的、または置換シンメトリーを示しています。四足歩行の動作は、運動の方向に依存しません。同様に、ロボットグリッパーはラベルに関係なく、複数の同一のアイテムと接触するかもしれません。ただし、この豊かな構造は、ほとんどの計画および強化学習（RL）アルゴリズムに考慮される必要があります。十分なトレーニングを受けた後、明確に定義された問題に対して印象的な結果を示しているにもかかわらず、これらのアルゴリズムは頻繁にサンプリングの非効率性や環境変化への耐性の欠如を示します。研究チームは、RLアルゴリズムが対称性を理解していることでサンプル効率と耐性を向上させることが重要であると考えています。これらのアルゴリズムは、2つの重要な要件を満たす必要があります。まず、世界とポリシーモデルは関連する対称性グループについて同変である必要があります。これは、離散時間シフトZの部分群、空間対称性グループSE(3)の積集合グループ、および具現化エージェントの1つ以上の対象置換群Snです。第二に、実際の問題の解決のために、対称性グループの(一部の)緩やかな崩壊が可能であるべきです。ロボットグリッパーの目標は、空間の指定された位置にオブジェクトを移動することであり、これにより対称性グループSE(3)が崩壊します。同変RLの初期の試みは、この技術の潜在的な利点を明らかにしました。ただし、これらの作品は通常、Cnなどの小規模な有限対称群のみを考慮し、テスト中の仕事に応じてソフトな対称性の崩壊を許可することはありません。この研究では、Qualcommの研究チームが、Equivariant Diffuser for Generating Interactions (EDGI) と呼ばれるモデルベースの強化学習および計画のための同変方法を提案しています。EDGIの基礎要素は、研究チームが具現化された文脈で遭遇することを予想している、SE(3) × Z × Snという完全な積集合群に関して同変です。さらに、EDGIはテスト時に柔軟なソフト対称性の崩壊を許可します。彼らの方法論は、以前に研究者から提案されたDiffuserメソッドに基づいており、ダイナミクスモデルの学習とその内部での計画の課題に対処しています。Diffuserの主な概念は、状態-行動の軌跡のオフラインデータセットで拡散モデルをトレーニングすることです。このモデルからの1つのサンプルは、現在の状態に条件付けられて計画されます。彼らの主な貢献は、多様な表現データを許容し、空間的、時間的、および置換対称性の積集合群SE(3) × Z × Snについて同変な拡散モデルを可能にすることです。研究チームは、個々の対称性に作用する革新的な時間、オブジェクト、および置換レイヤー、および複数の入力表現を単一の内部表現に埋め込む革新的な方法を提案しています。クラス分類の案内と条件付けと組み合わせることで、計画アルゴリズムに含まれるテスト時のタスク要件によって対称性グループを柔軟に崩壊させることができます。研究チームは、ロボットのアイテムハンドリングと3Dナビゲーションの設定を使用して、EDGIの客観的な検証を示しています。研究チームは、訓練データが桁違いに少ない状況で、EDGIが低データドメインでの性能を著しく向上させ、最良の非同変ベースラインと同等のパフォーマンスを発揮することを発見しました。さらに、EDGIは以前に発見されていない配置にも効果的に適応し、環境の対称性変化に対して明らかに耐性があります。

「MMMUと出会おう：専門家レベルのマルチモーダルなチャレンジに向けたAIベンチマークで人工知能の一般的な発展への道筋をつける」

マルチモーダルプリトレーニングの進歩は、LXMERT、UNITER、VinVL、Oscar、VilBert、VLPなどのモデルに示されるように、さまざまなタスクに対応しています。 FLAN-T5、Vicuna、LLaVAなどのモデルは、指示に従う能力を向上させます。 Flamingo、OpenFlamingo、Otter、MetaVLのような他のモデルは、文脈を持った学習を探求します。 VQAのようなベンチマークは認識に焦点を当てますが、MMMは大学レベルの問題における専門家レベルの知識と緻密な推論を要求することで際立っています。包括的な知識カバレッジ、さまざまな画像形式、および既存のベンチマークとは異なる主題特化の推論に対する独自の強調点といった特徴があります。 MMMベンチマークは、IN.AI Research、ウォータールー大学、オハイオ州立大学、インディペンデント、カーネギーメロン大学、ビクトリア大学、プリンストン大学などの様々な組織の研究者によって提案され、さまざまな学問をカバーする大学レベルの問題が含まれています。専門家レベルの認識と推論を重視したこのベンチマークは、現行のモデルにとって大きな課題を提示します。この研究では、人間の能力を超えるExpert AGIに向けた進歩を評価するためのベンチマークの必要性が強調されています。MMLUやAGIEvalなどの現行の基準はテキストに焦点を当てており、より多様なモーダルな課題が必要です。大規模なマルチモーダルモデル（LMMs）は有望でありますが、既存のベンチマークには専門家レベルのドメイン知識が必要です。MMMベンチマークはこのギャップを埋めるために導入され、複雑な大学レベルの問題に多様な画像形式と交差するテキストを特徴としています。これはLMMsにとって高度なAI能力を目指す難しい評価を要求し、専門家レベルの認識と推論を提供します。 Expert AGI評価のために設計されたMMMベンチマークは、6つの学問と30の科目にわたる11.5Kの大学レベルの問題で構成されています。データ収集は、視覚入力に基づいてトピックを選択し、学生のアノテータを参加させてマルチモーダルな質問を収集し、品質管理を実施することによって行われます。LLMsやLMMsを含む複数のモデルは、MMMベンチマークでゼロショットの設定で評価され、微調整やフューショットデモなしで正確な回答を生成する能力がテストされます。 MMMベンチマークは、GPT-4Vが55.7％の精度しか達成できないため、モデルにとって困難です。専門家レベルの認識と推論の要求により、LLMsやLMMsにとって厳しい評価となります。エラー分析により、視覚的な認識、知識表現、推論、およびマルチモーダル理解の課題が明らかになり、さらなる研究の領域が示唆されます。30種類の多様な画像形式で大学レベルの知識をカバーするMMMベンチマークは、基礎モデルの精度と専門分野での適用性を高めるためにドメイン固有の知識をトレーニングデータセットに豊かにすることの重要性を強調しています。まとめると、MMMベンチマークの作成はExpert AGIの評価においてLMMsの重要な進展を表しています。このベンチマークは、現行のモデルに基本的な感覚スキルと複雑な推論を評価する機会を提供し、Expert AGI開発の進歩を理解するのに役立ちます。専門家レベルのパフォーマンスと推論能力を重視し、視覚的な認識、知識表現、推論、およびマルチモーダル理解におけるさらなる研究の領域をハイライトします。専門分野の精度と適用可能性を向上させるために、トレーニングデータセットにドメイン固有の知識を豊かにすることが推奨されます。

NVIDIAは、AIプロセッサの供給において日本を優先しています

人工知能（AI）技術の世界的な覇権争いを反映した重要な動きとして、NVIDIAのCEOであるJensen Huangは、日本の急増するAIプロセッサーの需要に優先順位を付けるという同社の取り組みを確認しました。この取り組みは、日本が半導体インフラの再活性化を目指し、AI技術の開発で大きな進展を遂げるという野心的な取り組みと一致しています。AI技術の発展。日本での急増する需要 Jensen Huangは最近の声明で、日本でのNVIDIAのAIプロセッサーへの圧倒的な需要を認めました。東京の岸田文雄首相公邸での記者会見で、黄氏は緊急性を強調し、「需要は非常に高いですが、私は首相に約束しました。私たちは日本のGPUの要件を最優先にするために、非常に非常に最善を尽くします。」と述べました。日本の半導体再活性化かつて半導体技術の世界的リーダーであった日本は、産業の優位性を再構築するという使命を帯びています。同国はAI技術の急速な進化に追いつくため、半導体インフラに大きな投資を行っています。NVIDIAのグラフィックス処理ユニット（GPU）は、AI市場で主要なプレーヤーとなり、日本の復活に不可欠です。半導体投資への財政的支援わずか2週間前、日本は約2兆円（1360億ドル）の莫大な予算を追加し、半導体への投資に充てることを決定しました。この財政的支援により、台湾半導体製造（TSMC）や半導体ファウンドリーベンチャーのRapidusなど、半導体業界の重要なプレーヤーを支援することが期待されています。特にRapidusは、北海道で最先端のチップの製造を目指しています。日本の半導体自立の構築 Jensen Huangは日本の半導体産業に対して楽観的な見方を示しました。「日本が育てている産業はGPUを生産します。」これは、日本を含む国々がデータの所有権の重要性を認識している広範なトレンドを反映しています。彼らはAIファクトリーを確立し、国内のAIインテリジェンス能力を育成することを目指しています。読み物: NVIDIAが初の兆ドルAIチップ企業を目指す私たちの意見急速に進化する技術の風景において、NVIDIAが日本のAIプロセッサー要件に優先順位を付けることは、AIの能力を進化させるための協力の戦略的重要性を示しています。日本が半導体の強みを取り戻すために、NVIDIAのような業界のリーダーとのパートナーシップは、技術的自給自足を実現するための重要な要素となります。NVIDIAの先端のAI技術と日本の半導体イノベーションの復活の融合は、世界的なテクノロジーレースにおける重要な瞬間を象徴しています。国々がAIの領域での地位を確保する重要性をますます認識する中、このような協力は技術的に力強い未来のための重要な基盤となります。

リトリーバルオーグメンテッドジェネレーション（RAG）推論エンジンは、CPU上でLangChainを使用しています

「リトリーバル増強生成（RAG）は広範にカバーされており、特にチャットベースのLLMへの応用については詳しく語られていますが、本記事では異なる視点からそれを見て、その分析を行うことを目指しています...」

6つのGenAIポッドキャスト、聴くべきです

はじめに急速に進化する人工知能（AI）の世界において、生成AI（GenAI）の領域は魅力的でダイナミックな分野として注目されています。技術の進歩に伴い、この分野の微妙なニュアンスを理解することは重要ですが、最新情報を把握することは難しいかもしれません。GenAIは新しいコンテンツやデータを作成する能力で知られていますが、まだ比較的新しい分野ですので、最新の動向については多くの人が興味を持ちながらも情報を得ていません。この知識のギャップを埋めるために、GenAIの専門家がホストするポッドキャストは貴重な情報源となります。これらのポッドキャストは、最先端のテクノロジーの領域を探求したい学習者にとって、第一級の信頼できる情報を提供してくれます。以下に、生成AIの愛好家が聞くべきおすすめのポッドキャスト6つを紹介します。聴くべきトップ6のGenAIポッドキャスト 1. Leading With Data by Analytics Vidhya Analytics VidhyaはデータサイエンスとAIコミュニティで有名なプラットフォームであり、彼らのポッドキャスト「Leading With Data」ではデータサイエンス、機械学習、そしてなんと言っても生成AIについてさまざまな側面を探求しています。業界のリーダーや専門家、実践者との洞察に満ちた議論を期待してください。彼らは自らの経験、課題、そしてGenAIの未来へのビジョンを共有しています。コンテンツ形式：Leading With Dataでは業界リーダーや専門家、実践者との議論を取り上げ、GenAI、データサイエンス、機械学習などさまざまなトピックをカバーしています。対象読者：データサイエンス愛好者、専門家、生成AIの応用に関する洞察を得たい人々。このGenAIポッドキャストはSpotify、Apple Podcasts、Google Podcasts、YouTube、および彼らのコミュニティプラットフォームでご覧いただけます。 2. The…

なぜGPUはAIに適しているのか

GPUは人工知能の希少な地球の金属、さらには金そのものとも呼ばれています。それは、今日の生成的AI時代において基盤となる存在であるためです。それは3つの技術的理由と数多くのストーリーによって説明され、それぞれの理由には多くの側面がありますが、大まかに言えば次のようなものです。 GPUは並列処理を使用します。 GPUシステムはスーパーコンピュータの高さにまでスケールアップします。 AIのためのGPUソフトウェアスタックは幅広く深いです。その結果、GPUはCPUよりも高速かつエネルギー効率が優れており、AIのトレーニングおよび推論においても優れたパフォーマンスを提供し、高速計算を使用するさまざまなアプリケーションにおいても利益をもたらします。スタンフォード大学のヒューマンセンタードAIグループの最近のレポートによれば、GPUのパフォーマンスは「2003年以来約7000倍」向上し、価格性能比は「5600倍」増加していると報告されています。 2023年のレポートは、GPUのパフォーマンスと価格性能の急激な上昇を捉えています。レポートはまた、AIの進展を測定し予測する独立系の研究グループであるエポックの分析も引用しています。「GPUは、機械学習ワークロードを高速化するための主要なコンピューティングプラットフォームであり、過去5年間のほとんど（もしくはすべて）の最大のモデルがGPU上でトレーニングされています… それにより、AIの最近の進歩に重要な貢献をしています」とエポックはサイトで述べています。また、米国政府のためにAI技術を評価した2020年の研究も同様の結論を導いています。「製造および運用コストを含めた場合、最先端のAIチップは生産性と運用コストをリーディングノードCPUよりも1〜3桁高いと予想されます」と述べています。「NVIDIAのGPUは、過去10年間にAI推論のパフォーマンスを1000倍向上させました」と同社の首席科学者であるビル・デーリー氏は、半導体およびシステムエンジニアの年次集会であるHot Chipsの基調講演で述べています。 ChatGPTがニュースを広める ChatGPTは、GPUがAIにとって優れたものであることを強力に示した例です。数千のNVIDIA GPUでトレーニングされ、実行される大規模な言語モデル（LLM）は、1億人以上の人々が利用する生成的AIサービスを提供しています。その2018年のリリース以来、AIの業界標準ベンチマークであるMLPerfは、NVIDIA GPUのトレーニングおよび推論のリーディングパフォーマンスを詳細に示しています。例えば、NVIDIA Grace Hopper Superchipsは最新の推論テストで圧倒的な成績を収めました。そのテスト以降にリリースされたNVIDIA TensorRT-LLM推論ソフトウェアは、パフォーマンスを最大8倍向上させ、エネルギー使用量と総所有コストを5倍以上削減します。実際、NVIDIA…

「9つの方法でAIがデータセンターセキュリティを向上させる」

データセンターは人工知能を用いて従来の技術を刷新し、サイバーセキュリティと物理セキュリティを劇的に向上させることができます以下は、データセンターセキュリティを向上させるために使用できる9つの主な方法です1. 管理の自動化 IT部門は大量の業務を抱えている場合がありますチケットの数量が多いか、絶え間なく受け付け...

アマゾンセージメーカーとAWSバッチを使用して、ゲティールはモデルトレーニングの時間を90%短縮しました

この記事は、Nafi Ahmet Turgut、Hasan Burak Yel、およびDamla ŞentürkがGetirから共同執筆したものです2015年に設立されたGetirは、超高速の食品配達の先駆者として位置づけられていますこの革新的なテクノロジー企業は、「数分で食料品を提供する」という魅力的な提案で、最終マイル配送セグメントを革命的に変革しました[...]

Learn more about Search Results A - Page 38