Search Results ML

Google AIは、屋外での人間の視点によるシーン理解のためのマルチ属性ビデオデータセットであるSANPOを導入しました

自動運転などのタスクにおいて、AIモデルは道路や歩道の3D構造だけでなく、道路標識や信号機を識別・認識する必要があります。このようなタスクは、自動車に取り付けられた特殊なレーザーが3Dデータをキャプチャすることで容易に行われます。このようなプロセスは、エゴセントリックシーン理解と呼ばれ、自身の視点から環境を理解することを意味します。問題は、エゴセントリックな人間のシーン理解に適用できる公開データセットが自動運転領域を超えて存在しないことです。 Googleの研究者たちは、人間のエゴセントリックなシーン理解のためのマルチ属性ビデオデータセットであるSANPO（Scene understanding, Accessibility, Navigation, Pathfinding, Obstacle avoidance）データセットを導入しました。SANPOには、SANPO-RealとSANPO-Syntheticの2つの実世界データと合成データが含まれています。SANPO-Realは多様な環境をカバーしており、マルチビュー手法をサポートするために2つのステレオカメラからのビデオが含まれています。実データセットには、15フレーム/秒（FPS）でキャプチャされた11.4時間のビデオと密な注釈が含まれています。 SANPOは、エゴセントリックな人間のシーン理解のための大規模なビデオデータセットであり、密な予測注釈を持つ60万以上の実世界および10万以上の合成フレームから成り立っています。 Googleの研究者たちは、プライバシー保護を優先しています。彼らは現地、市、および州の法律に従ってデータを収集しています。また、注釈のためにデータを送信する前に、顔や車両ナンバープレートなどの個人情報を削除するようにしています。ビデオのキャプチャ中のモーションブラー、人間の評価ミスなどの欠点を克服するために、SANPO-Syntheticが導入されました。研究者は、実世界の環境に合わせて最適化された高品質な合成データセットを作成するために、Parallel Domainと提携しました。SANPO-Syntheticには、バーチャル化されたZedカメラを使用して記録された1961のセッションが含まれており、ヘッドマウントとチェストマウントの位置の均等な分布があります。合成データセットと一部の実データセットは、パノプティックインスタンスマスクを使用して注釈が付けられました。SANPO-Realでは、フレームごとに20を超えるインスタンスがあるのはわずかです。それに対して、SANPO-Syntheticには実データセットよりもずっと多くのインスタンスが含まれています。この分野での他の重要なビデオデータセットには、SCAND、MuSoHu、Ego4D、VIPSeg、Waymo Openなどがあります。SANPOはこれらのデータセットと比較され、パノプティックマスク、深度、カメラ姿勢、マルチビューステレオ、実データと合成データを兼ね備える最初のデータセットです。SANPOの他に、パノプティックセグメンテーションと深度マップを兼ね備えたデータセットはWaymo Openだけです。研究者は、SANPOデータセット上で2つの最先端モデル、BinsFormer（深度推定）とkMaX-DeepLab（パノプティックセグメンテーション）を訓練しました。彼らは、このデータセットは両方の密な予測タスクにとって非常に挑戦的であることを観察しました。また、合成データセットの方が実データセットよりも精度が高いことも確認されました。これは、現実世界の環境が合成データよりも複雑であるためです。さらに、セグメンテーション注釈においては、合成データの方がより正確です。人間のエゴセントリックなシーン理解のデータセットの不足に対処するために導入されたSANPOは、実世界と合成データセットの両方を網羅しており、密な注釈、マルチ属性の特徴、パノプティックセグメンテーションと深度情報のユニークな組み合わせによって他のデータセットとは異なる存在です。さらに、研究者たちのプライバシーへの取り組みは、視覚障害者のための視覚ナビゲーションシステムの開発をサポートし、高度な視覚シーン理解の可能性を広げるために、このデータセットを他の研究者に提供することができます。

このAIの論文は、テキスト変換グラフとして言語モデルパイプラインを抽象化するプログラミングモデルであるDSPyを紹介しています

言語モデル（LM）は、リサーチャーにデータを少なく使用し、より高度な理解レベルで自然言語処理システムを作成する能力を与えています。これにより、「プロンプト」メソッドや軽量なファインチューニングの技術が増加し、新しいタスクにおいてLMが動作するための方法が開発されています。ただし、問題は、各タスクごとにLMに尋ねる方法が非常に敏感であることであり、単一のプロセスで複数のLMの相互作用がある場合にこの問題がさらに複雑になります。機械学習（ML）コミュニティは、言語モデル（LM）をプロンプトする方法や複雑なタスクに取り組むためのパイプラインの構築方法を積極的に探索しています。残念ながら、既存のLMパイプラインはしばしば、試行錯誤を重ねて見つけられた長い文字列である「プロンプトテンプレート」に依存しています。LMパイプラインの開発と最適化におけるより体系的なアプローチを追求するために、スタンフォードなどのさまざまな機関の研究者チームは、DSPyというプログラミングモデルを導入しました。DSPyは、LMパイプラインをテキスト変換グラフに抽象化するものです。これらは基本的には命令型の計算グラフであり、LMは宣言型モジュールを通じて呼び出されます。 DSPyのモジュールはパラメータ化されており、提示、ファインチューニング、拡張、推論技術の組み合わせを適用する方法を学習できます。彼らはDSPyパイプラインを最大化するためのコンパイラを設計しました。 DSPyコンパイラは、DSPyプログラムの品質やコスト効率を向上させることを目的として開発されました。コンパイラは、プログラム自体と、オプションのラベルとパフォーマンス評価のための検証メトリックを含む、少量のトレーニング入力を入力として受け取ります。コンパイラの動作は、提供された入力を使用してプログラムの異なるバージョンをシミュレートし、各モジュールのための例のトレースを生成することに関与します。これらのトレースは、自己改善の手段として使用され、効果的なフューショットプロンプトの作成やパイプラインのさまざまな段階での小規模な言語モデルのファインチューニングに活用されます。重要な点として、DSPyの最適化方法は非常に柔軟です。彼らは「テレプロンター」と呼ばれる手法を使用しており、システムの各部分がデータから最善の方法で学習することを保証するための一般的なツールのようなものです。 2つの事例研究を通じて示されたように、簡潔なDSPyプログラムは、数学のワード問題の解決、マルチホップリトリーバルの処理、複雑な質問に答える、エージェントループを制御するなどの高度なLMパイプラインを表現し最適化することができます。コンパイル後のわずか数分で、わずか数行のDSPyコードを使用して、GPT-3.5やllama2-13b-chatを自己ブートストラップパイプラインにすることができ、従来のフューショットプロンプトに比べて25％以上および65％以上の性能を実現します。結論として、本研究はDSPyプログラミングモデルとその関連するコンパイラを介して自然言語処理への画期的なアプローチを紹介しています。複雑なプロンプト技術をパラメータ化された宣言型モジュールに変換し、一般的な最適化戦略（テレプロンター）を活用することで、これによるNLPパイプラインの構築と最適化を非常に効率的に行う新しい方法を提供しています。

「Apple M1とM2のパフォーマンス- SSLモデルのトレーニングにおいて」

新しいAppleチップを使用してMLモデルをトレーニングするためのベンチマークの数はまだ少ないですさらに、ほとんどの結果は、M1チップと以前のソフトウェアバージョンを比較しているだけであり、それらが適切でなかった可能性もあります...

AIと機械学習のためのReactJS：強力な組み合わせ

このブログ記事では、ReactJSとAI/MLが組み合わされることで、パワフルでインタラクティブなウェブアプリケーションを構築する方法について探っていきます

「Microsoft AIが意図せずに秘密の情報を公開し、3年間にわたって38TBの機密データへのアクセス権を提供しました」

「過剰供給されたSASトークンが、約3年間にわたってGitHub上で38TBもの大量の個人データを公開していた物語」

なぜ人々は人工知能AIを恐れているのか？

人工知能（AI）のイノベーションのペースは驚くべきものです。AIは現在、ロボティクス、IoT、ビッグデータなどの技術の推進力となっており、ChatGPTなどの生成型AIツールも広範な注目を集めています。AIによって、コンピューターは膨大なデータからスマートな意思決定と発見をすることができ、将来的にさらなるイノベーションの道を拓くことができるでしょう。しかし、このAIの台頭は一部の人々の懸念を引き起こしました。彼らはAIが仕事を奪い、将来的には人間と独立して運営される可能性を恐れています。本記事では、なぜ人々がAIを恐れ、その恐怖や誤解をどのように扱い、軽減することができるのかを探っています。 AIはどのように人間の生活を改善できるのか？医療医療業界は既にAIによる変革を体験しています。AIはデータ分析能力を活用して、より速く正確に病気を検出することができます。たとえば、がんの兆候を治療が容易な段階で発見することができます。また、薬剤の開発プロセスを効率化し、患者の状態をチェックする仮想看護師のような役割も果たすことができます。交通自動運転車がより普及するにつれて、交通業界は革命を起こすことになります。これらの車はAIを活用して安全かつ効率的に運転し、事故を減らし、旅行を容易にします。さらに、AIはナビゲーションを補助し、質問に答え、運転をより便利で楽しいものにするためのスマートボイスアシスタントなど、他の役割でも活躍しています。さらに、AIは車の設計にも創造的に活用されています。車を効率的で快適で環境に優しいものにするための新しいアイデアを開発することができます。教育 AIは、さまざまな年齢の人々のために教育を変革する力を持っています。機械学習や人間の言語理解、顔認識などのスマートテクノロジーを活用して学習を改善することができます。たとえば、AIは通常の教科書をデジタル化し、画面から学びやすくすることができます。また、AIはプラギアリズムを発見するのにも役立ち、公平な学習を保証します。さらに、AIは生徒が授業を難しいと感じるか簡単すぎると感じるかを感情を見ることで判断し、学習をより適応的に調整することもできます。これらの分野に加えて、AIはさまざまな他の産業を変革する潜在能力を持っています。現在は、チャットボットや仮想アシスタントによる顧客サービスの向上に貢献しています。また、AIはスマートホームにおいても、サーモスタットや照明などのデバイスを制御し、暮らしをよりスマートにしています。AIの可能性は広大で、さらに拡大し続けています。その有用性にもかかわらず、AIに対する懸念は増え続けています。では、人々がAIを恐れる理由について考えましょう。「AIの潜在能力を認識し、それを日常業務に取り入れる方法を積極的に探し求める先見の明るい企業は、成功に向けた位置づけをしています。AI対人間の問題ではありません。AIは人間の能力を補完し、これまで以上の成果をあげるために人間と協力する存在です。私たちの共同責任は、チームを教育し、この技術を活用して個々の効率と生産性を向上させるだけでなく、産業全体の向上のためにその未来を展望することです。共に、無類の進歩とイノベーションをもたらす機会を持っています。」−Pixisの共同創設者兼グローバルCEO Shubham A. Mishra−である。なぜ人々はAIを恐れているのか？ 2023年3月、イーロン・マスクを含む1000人以上のAIの専門家が、リスクを適切に理解するために数か月間大規模なAIシステムの開発を一時停止するよう求める公開書簡を発表しました。この恐怖の背後にある主な理由の1つは、専門家たちが近い将来、AIが人間から独立して作業できるようになる可能性があると信じていることです。AIシステムが進化する速度を考慮すると、かつてSFの可能性とされていたシナリオが時間の問題とされています。専門家たちはまた、AIが人間の自律性を脅かすだろうと予測しており、パターン認識、分析、複雑な意思決定などのタスクにおいて、コンピューターが人間の知能を追い越すか、さらに上回る可能性があると考えています。人工知能は、知識があるだけでなく、私たちの情報をプライベートに保つという人間の関心事も尊重するようになって欲しいと思っています。間違ったやり方で行えば、それはかなり危険です。大量のデータを持つことは、迷惑メールの停止や好みのものを提案するなど、善意のことをするのに役立つことがあります。しかし、時にはプライバシーや公正な扱いにも影響を与えることがあります。仕事の喪失の恐怖は、人々がAIに不安を感じる別の理由です。数ヶ月前、BTは2030年までに最大55,000人の仕事を削減することを決定し、AIに進出しています。AIは教育にも影響を及ぼしており、ChatGPTのようなツールを使用して学生のエッセイを素早く書くことができ、GPT-4は米国の司法試験で好成績を収めました。ただし、人工汎用知能（AGI）について話すと、リスクはさらに深刻であり、命にも関わる可能性さえあります。 AIの課題とリスクをどのように克服するか？政府は、テック企業がAIを訓練するために使用できる計算能力とデータの量を制限することができます。 AIがアクセスできる知識を制限することもできます。例えば、バイオテクノロジー、核兵器、個人情報などの情報を隠すことができます。…

Tech

Learn more about Search Results ML - Page 217

Google AIは、屋外での人間の視点によるシーン理解のためのマルチ属性ビデオデータセットであるSANPOを導入しました

このAIの論文は、テキスト変換グラフとして言語モデルパイプラインを抽象化するプログラミングモデルであるDSPyを紹介しています

「Apple M1とM2のパフォーマンス- SSLモデルのトレーニングにおいて」

AIと機械学習のためのReactJS：強力な組み合わせ

「Microsoft AIが意図せずに秘密の情報を公開し、3年間にわたって38TBの機密データへのアクセス権を提供しました」

なぜ人々は人工知能AIを恐れているのか？

記述的な質問に対する戦略的なデータ分析’ (Kijutsu-teki na shitsumon ni tai suru senryakuteki na data bunseki)

ミネソタ湖のデータのクリーニング+準備

「機械学習入門：その多様な形式を探索する」

「AIと自動化ソフトウェアがビール業界を変える7つの方法」

Find the right Blockchain Investment for you