Learn more about Search Results スペイン語 - Page 9
- You may be interested
- 「Google DeepMindと東京大学の研究者が、...
- 「トランスフォーマーは戦略を学ぶことが...
- ランチェーン101:パート2c PEFT、LORA、...
- 「責任あるAI:AI利用の暗い側面を回避す...
- メタのLlama 2モデルの概要:新機能は何で...
- AIの環境負荷軽減:アプリを持続可能にす...
- 「Amazon SageMakerを使用して、効率的に...
- BTSの所属レーベルHYBEがAIを活用して複数...
- 「Azure OpenAIを使用した企業文書とのチ...
- 「制限されたデータで言語モデルをトレー...
- 「LLMはどのようにテキストを生成するのか...
- このGoogleとUC BerkeleyのAI論文は、NeRF...
- 「MozillaがFirefoxに偽レビューチェッカ...
- 1Bのトレーニングペアで文埋め込みモデル...
- 「AIがPowerPointと出会う」
DeepMindのロボキャットに会ってください:複数のロボットを操作するために設計された新しいAIモデル
ロボットは急速にメインストリーム文化に入りつつありますが、彼らは通常、彼らのプログラミングのために彼らの能力が制限されています。 最近のAIの進歩をロボットの設計に取り入れることの潜在的な利点にもかかわらず、一般的な目的のロボットを開発するための進展は、現実のトレーニングデータを取得するために必要な時間のために遅れています。 多くのタスクを一度に学習し、ヘルパーロボットの実用的な能力に言語モデルの理解を統合する能力を持つロボットの開発は、広範な研究の対象となっています。 DeepMindのRoboCatは、複数のタイプの実際のロボットでさまざまなタスクを解決し適応する最初のエージェントです。 調査結果によると、RoboCatは他の最先端のモデルよりもはるかに速く学習します。 多岐にわたるデータセットから学習するため、100回のデモンストレーションで新しいスキルを習得できます。 この能力は、多目的ロボットを開発するために重要であり、人間の監視されたトレーニング要件を減らすことにより、ロボット工学の研究を加速します。 彼らのマルチモーダルモデルGato(スペイン語で「猫」)は、RoboCatの基盤となっています。仮想世界と現実世界の両方で言葉、視覚、行動を処理できます。 彼らの作品では、何百ものロボットアームがさまざまな仕事をしているビジュアルと動作のデータを含む大規模なトレーニングデータセットとGatoの構造を融合させました。 この初期のトレーニングフェーズの後、チームはRoboCatを新しい活動の「自己改善」トレーニングサイクルに入れました。 各新しい活動は、以下の5つの段階で学習されました。 新しいタスクまたはロボットを人間が制御するロボットアームで100から1000の例を収集する。 新しいタスク/アームのためにRoboCatを微調整して、専門的な能力を持つスピンオフエージェントを生成する。 子のエージェントは、新しいタスク/アームに対して練習を10,000回繰り返し、トレーニングデータプールに追加する。 サンプルデータをユーザーの作成物およびデモンストレーションデータと混合して、RoboCatの現在のデータセットに統合する。 更新されたデータセットを使用してRoboCatを再トレーニングする。 RoboCatの最新バージョンは、数百万の軌跡を含むデータセットに基づいています。実際のおよびシミュレートされたロボットアームからのビジョンベースのデータ、および多数のロボットアームを使用して収集されたジョブを描くデータが含まれます。 RoboCatはわずか数時間で複数のロボットアームを使用するようにトレーニングされました。 彼は、二本爪のグリッパーを持つアームで教えられたにもかかわらず、より複雑な三本指のグリッパーを持つアームを使うことを学びました。 RoboCatは、1000人の人間が制御するデモンストレーションを目撃した後、歯車を86%の確率で拾うことができるようになりました。 同じ程度のデモにより、フルーツボウルから正しい果物を選ぶなど、精度と知識の両方が必要なタスクを実行する方法を学びました。 RoboCatのトレーニングは自律的に継続されます。 彼が学ぶほど、彼は学ぶ能力を向上させます。 チームは、各タスクの500のデモから学んだ後、RoboCatの最初のバージョンは、これまで見たことのない活動を実行するために36%しか効果的ではありませんでした。…
再帰型ニューラルネットワークの基礎からの説明と視覚化
再帰型ニューラルネットワーク(RNN)は、順次操作が可能なニューラルネットワークです数年前ほど人気はありませんが、重要な発展を表しています...
Gmailを効率的なメールソリューションに変える6つのAI機能
GoogleのGmailは、人工知能(AI)の力を活用してユーザーエクスペリエンスを向上させることに最前線で取り組んでいます。AIをプラットフォームに統合する歴史を持ち、Gmailは進化を続け、電子メールの管理を簡素化し、コミュニケーションを効率化する機能を提供しています。この記事では、Gmailを世界中のユーザーにとって必須のツールにする6つのAI機能を探究します。 1. 「書き方を教えて」: Gmailの最新機能である「書き方を教えて」機能は、シンプルなプロンプトに基づいて完全なメールの下書きを生成し、ユーザーが簡単にメールを作成することができるようにします。Workspace Labsプログラムを介してアクセスできるこの機能により、生成的AI言語モデルを活用して、ユーザーは自分の好みに応じてメールを磨き、カスタマイズ、調整することができます。また、このツールは、以前の会話から詳細を抽出し、文脈に沿ったアシストを提供することもできます。 2. Smart Compose: Smart Composeは、ユーザーがタイプする間に文言のオプションを提案することで、メール作成を革命化します。 Tensor Processing Units (TPUs) 上で動作するこのハイブリッド言語生成モデルにより、ユーザーは「Tab」ボタンを1回タップするだけで提案されたフレーズや文章を自分の下書きに組み込むことができます。効率性を向上させるだけでなく、Smart Composeは新しい英語、スペイン語、フランス語、イタリア語のフレーズを提示することによって言語学習者を支援します。 3. Smart Reply: GmailのSmart Reply機能は、受信したメッセージに対して文脈に沿った最大3つの返信を提供することで、メールのコミュニケーションを加速します。深層ニューラルネットワークを含む高度な機械学習技術によって動作するSmart Replyは、単純な「はい」または「いいえ」の回答を超えた微妙なオプションを提供します。ユーザーは迅速に適切な返信を選択して送信することができ、時間と労力を節約することができます。Smart Replyは、ユーザーのコミュニケーションスタイルに適応し、パーソナライズを向上させます。 4.…
あなたの時間を節約するための6つのGmail AI機能
これらの人工知能(AI)によるGmailの機能は、あなたの電子メールの体験をよりスピーディーで整理されたものにすることができます
メタのボイスボックス:すべての言語を話すAI
Facebookの親会社であるMetaは画期的な開発を発表し、最新の生成型人工知能(AI)であるVoiceboxを公開しました。従来のテキストベースのAIモデルとは異なり、Voiceboxは音声合成に特化しており、話し方を模倣し、自然な音声クリップを生成することができます。異なる言語でテキストを読み取り、没入型メタバースに貢献する能力を持つVoiceboxは、コミュニケーションとアクセシビリティを革新することを約束しています。この革新的なAIの詳細について見ていきましょう。 また読む:Metaがテキスト、画像、音声を同時にトレーニングしたAIモデルをオープンソース化 生成型AIの進化:テキストから音声へ ChatGPTやGoogleのBardなどの生成型AIモデルは、自然言語処理と機械学習を使用して、テキストベースの応答を生成することができます。しかし、MetaのVoiceboxは、代わりに音声クリップを生成することで、このコンセプトを一歩先に進めています。このユニークなアプローチにより、コミュニケーションと没入型体験の可能性が広がります。 また読む:テキストから音声へ、音声からテキストへの完全なガイド Voicebox:2秒間の音声サンプルの力 Metaが金曜日に発表したVoiceboxは、音声合成のための新しい技術を導入しています。たった2秒の音声サンプルを使用するだけで、Voiceboxは音声スタイルを分析し、テキストから音声を生成したり、外部ノイズによって中断された音声をシームレスに再作成することができます。この画期的な技術は、コミュニケーションのギャップを埋め、音声インタラクションの品質を向上させることを目的としています。 言語の壁を破る:多言語対応 Voiceboxの最も印象的な機能の1つは、様々な外国語で英語のテキストを読み取ることができる能力です。フランス語、ドイツ語、スペイン語、ポーランド語、ポルトガル語など、Voiceboxは、所望の言語で自然な音声に変換することができます。これにより、グローバルなコミュニケーションや言語学習の新たな可能性が生まれます。 メタバースの向上:デジタル世界を活気づける声 Metaは、仕事や遊び、交流の場として人々が集まるデジタル世界で、Voiceboxを強力なツールとして位置付けています。自然な音声を仮想アシスタントや非プレイヤーキャラクター(NPC)に提供することで、Voiceboxは、これらのデジタル環境に現実感と没入感を加えます。さらに、友人の馴染みのある声で読み上げられたメッセージを聞くことができるようになることで、視覚障がい者の方々に役立つ可能性もあります。 また読む:NVIDIAがAIを活用したリアルなゲームキャラクターの構築ツールを導入 倫理的な考慮事項:真正性と潜在的な不正使用のバランス Voiceboxには大きな可能性がある一方、Metaは潜在的な倫理的な懸念に対処する必要があると認識しています。同社は、Voiceboxによって生成されたオーディオと本物の音声を区別することで、潜在的な被害を防止するために積極的に取り組んでいます。Metaの責任あるAI開発への取り組みにより、Voiceboxは慎重に展開され、保護策が整備されます。 また読む:EUがDeepfakesやAIコンテンツを特定するための措置を呼びかけ 私たちの意見 MetaのVoicebox AIは、音声合成と多言語コミュニケーションにおいて重要な進歩を表しています。様々な言語で自然な音声を可能にし、没入型のデジタル環境に貢献することで、Voiceboxは、私たちが世界とのやり取りをする方法を変える可能性を秘めています。Metaがこの革新的なAI技術をさらに磨き上げるにつれて、限界に挑戦することと責任ある使用のバランスを保つことが重要です。Voiceboxによって、コミュニケーションの未来は、今まで以上に包括的でアクセスしやすく、魅力的になるでしょう。 詳細はこちら:ジェネレーティブAIの無限の世界を開放し、DataHack Summit 2023でこのような革新的な技術について学びましょう。
Voicebox メタ社の驚異的な音声生成AIツール
Meta(旧Facebook)は、革新的な音声生成を実現する最新の生成AIモデル「Voicebox」をリリースしました
Amazon TranslateのActive Custom Translationを使用して、マルチリンガル自動翻訳パイプラインを構築します
Deep Learning(D2L.ai)に飛び込むは、深層学習を誰にでもアクセス可能にするオープンソースのテキストブックですPyTorch、JAX、TensorFlow、MXNetで自己完結型のコードを含む対話型Jupyterノートブック、実世界の例、解説図、数学などが特徴ですこれまでに、D2Lは世界中の400以上の大学で採用されています、例えば[...]
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.