「Googleのおかげで、ロボットにとっての『ChatGPT』の時代は今までにないほど近づいています」

『Googleの力によって、ロボットにとっての「ChatGPT」の時代は今までにないほど迫ってきました』

GoogleのRT-Xロボットがここにあります

Andy Kellyによる写真、Unsplashで使用

Google Deepmindはロボット技術においてOpenAIが自然言語モデルの分野において行っているような存在です。

そして、AIベースのロボティクスは高い知能を持つAIモデルを具現化するという侵 intrusiveな考えから、恐怖と興奮を同量に引き起こしていますが、この週、その分野が確実に「ChatGPT」の時代に近づいていることを示す証拠が見られました。

それが好きであろうとなかろうと。

そして、彼らの新しいモデル、RT-XファミリーはAIがもはや引き返すことのできない地点に到達したという事実を示しています。

この記事は私の無料週刊ニュースレター、TheTechOasisで数日前に最初に公開されました。

将来に向けた行動を起こすことや、少なくとも将来に備えるためにインスピレーションを受けるため、人々の中でAI分野でリーダーとなるため、この情報について最新情報を知りたい場合は、このメールマガジンを購読してください。

🏝 下記に購読 🏝し、自分の同僚の中でAIのリーダーになり、VoAGIを含む他のどのプラットフォームにも存在しないコンテンツを入手することができます。

購読 | TheTechOasis

AIの最先端に進むためのニュースレター

thetechoasis.beehiiv.com

複数体運動予測者

数か月前、私はRT-2について書きました。これはGoogle Deepmindの状態を表すは最新のロボットアームです。

RT-2、普遍的なアーム

このモデルは、その時点では画期的なものであり、VLA(Vision-Language-Action)モデルでした。ビデオフレームと指示が与えられた場合、ロボットに取り付けられたカメラからの観察に基づいて、指示を実行するためにアクチュエータが必要な運動を予測しました。

出典: Google Deepmind

アーキテクチャ的には、このモデルはビジョントランスフォーマーとLLMで構成されていました。

前者は画像を処理し、後者はテキストを処理し、それぞれの入力を共通の埋め込み空間にエンコードしました…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AIニュース

「Amazon SageMaker StudioでAmazon SageMaker JumpStartを使用して安定したDiffusion XLを利用する」

「今日、私たちはお知らせすることを喜んでいますStable Diffusion XL 1.0(SDXL 1.0)がAmazon SageMaker JumpStartを通じて...

機械学習

このAI論文は、「GREAT PLEA」倫理的フレームワークを提案しています:医療における責任あるAIのための軍事に焦点を当てたアプローチ

ピッツバーグ大学、ウェル・コーネル・メディシン、テレメディシン&先進テクノロジー研究センター、統合失調症(USU)、ブル...

AI研究

大規模な生体分子動力学のためのディープラーニング:ハーバード大学の研究では、さまざまなシステム上で大規模で事前に学習されたアレグロモデルをスケーリングしています

計算生物学、化学、材料工学は、原子スケールでの物質の時間進化を予測する能力に依存しています。量子力学は、原子や電子の...

機械学習

このAI論文は、自律言語エージェントのためのオープンソースのPythonフレームワークである「Agents」を紹介しています

カスタマーサービス、コンサルティング、プログラミング、執筆、教育などのタスクでは、言語エージェントは人間の労力を削減...

機械学習

「P+にお会いしましょう:テキストから画像生成における拡張テキスト反転のための豊かな埋め込み空間」

テキストから画像の合成は、テキストのプロンプト記述から現実的な画像を生成するプロセスを指します。この技術は、人工知能...

データサイエンス

なぜディープラーニングは常に配列データ上で行われるのか?新しいAI研究は、データからファンクタまでを一つとして扱う「スペースファンクタ」を紹介しています

暗黙のニューラル表現(INR)またはニューラルフィールドは、3D座標を3D空間の色と密度の値にマッピングすることによって、3D...