Learn more about Search Results もっと詳しく - Page 5
- You may be interested
- 事前学習された拡散モデルを用いた画像合成
- 「メーカーに会う ロボット学生がNVIDIA J...
- ゼロからdbtモデルを設計する方法
- 「Text2Cinemagraphによるダイナミックな...
- ディープフェイクビデオを出し抜く
- 「6週間でCassandraにベクトル検索を追加...
- 仮想現実における人間の動作認識の進展:...
- 「Python Pandasを使ったカテゴリカルデー...
- 人工知能(AI)エージェント進化のフロン...
- Google AI Researchは、正確な時空間の位...
- クラウドの保護:クラウドセキュリティの...
- AI(人工知能)はキッチンを乗っ取ってい...
- 「プロンプトエンジニアリング入門ガイド」
- タイムシリーズ分析:PythonにおけるARIMA...
- 「ROUGEメトリクス:大規模言語モデルにお...
ディープネットワークの活性化関数の構築
ディープニューラルネットワークの基本的な要素は、活性化関数(AF)です活性化関数は、ネットワーク内のノード(「ニューロン」)の最終出力を形成する非線形関数です一般的な活性化関数は...
「モデルの解釈性のためのPFIに深く入り込む」
「モデルの評価方法を知っていることは、データサイエンティストとしての仕事において不可欠ですステークホルダーに完全に理解し、伝えることができない場合、誰もあなたの解決策に同意しません...」
「Appleが『AppleGPT』チャットボットを使った生成AI競争に参入」
テック大手のAppleは、大いに期待されているAI搭載チャットボット「AppleGPT」という仮の名前で進んでいます。この革新的なプロジェクトは、「Ajax」というGoogle JAXによって動力付けられた大規模言語モデル(LLM)フレームワークを利用しており、会社内では綿密に秘密にされてきました。しかし、情報筋によれば、Appleはこの最先端の技術に取り組んでおり、近い将来、重要なAIに関連する発表を行う準備をしています。Appleの生成AIへの重要な一歩についてもっと詳しく見てみましょう。 また読む:WWDCのハイライト:Appleの実用的なAIソリューションが明らかに AppleGPTの台頭:創造的なAIの驚異 Appleは長い間、AI技術をソフトウェアに統合する取り組みをしてきました。しかし、生成AIの分野にはまだ進出していません。コードネーム「AppleGPT」と呼ばれるこのチャットボットは、高度な言語モデルと印象的な機能によってゲームを変えるものです。 また読む:Elon MuskのxAIがOpenAIのChatGPTに挑む Ajax:AppleGPTの知性の源泉 AppleGPTの中核には、「Ajax」というフレームワークがあります。これは、Google JAXを使って機械学習の研究を促進するために作られた強力な言語モデルです。この最先端のフレームワークはGoogle Cloud上で動作し、Appleの複数のチームが利用しています。同社はプライバシーの影響に注意を払っていますが、エンジニアたちは内部でこの技術を探索し、パフォーマンスを調整しています。 Appleの沈黙する追求:他とは異なる存在感 Meta、Microsoft、Googleなどの他のテック大手が急速に生成AI製品を一般に公開している中、Appleはこの分野で多少なりとも存在感を示してきました。興味深いことに、同社は従業員に対してChatGPTの利用を禁止しており、自社のAIに関する取り組みに対して高い秘密主義を示しています。 また読む:プライバシーの懸念から禁止した後、AppleがChatGPTを推進する矛盾した動き Siriの遺産とその先:AppleのAIの旅 AppleのAIへの取り組みは、象徴的な音声アシスタントであるSiriから始まりました。SiriはAI音声技術の普及に大きな役割を果たしてきましたが、批評家たちはまだ改善の余地があると指摘しています。このため、AppleはかつてGoogleの一員であったジョン・ジャナンドリアをAIおよび機械学習チームのリーダーに迎え入れ、AIの能力を向上させるという明確な取り組みを示しました。 Tim Cookのビジョン:AppleのAIへのアプローチ AppleのCEOであるTim Cookは、AI技術の潜在能力に大きな関心を示しています。最近のインタビューや収益発表で、CookはAIが同社の将来の開発の焦点であることを強調しました。ただし、彼はAI製品に関連する特定の課題と懸念にも対処する必要があると認識しています。 また読む:AppleのCEO Tim CookがChatGPTを受け入れ、AIの未来について話す 協力の取り組み:全ての人のためのLLM…
「GoogleのAI Red Team:AIを安全にするための倫理的なハッカー」
先月、私たちはSecure AI Framework(SAIF)を紹介しましたこれは、AIシステムへのリスクに対処し、技術のセキュリティ基準を責任ある方法で推進するために設計されていますこの勢いに乗るために、本日は、SAIFをサポートするために展開する重要な機能の1つであるレッドチーミングについて新しい報告書を公開していますレッドチーミングは、AIシステムへの攻撃に備えるために、すべての組織に対して決定的な役割を果たすと考えており、皆さんが安全にAIを利用できるように協力することを楽しみにしていますこの報告書では、専用のAIレッドチームを立ち上げるための私たちの取り組みについて調査しており、次の3つの重要な領域を含んでいます:1)AIシステムの文脈でのレッドチーミングとは何か、なぜ重要か、2)AIレッドチームがシミュレートする攻撃の種類、3)他の人々と共有できる学んだ教訓レッドチーミングとは何か?Google Red Teamは、さまざまな敵対者(国家、有名な高度な持続的脅威(APT)グループ、ハクティビスト、個々の犯罪者、悪意のある内部者など)をシミュレートするハッカーチームですこの用語は軍から来ており、一つのチームが敵対的な役割(「レッドチーム」)を果たし、「ホーム」チームに対抗する活動を指しています
データセットシフトのフレームワークを整理する
私たちはモデルを訓練し、それらを使用して特定の結果を予測します入力のセットが与えられた場合に、それが機械学習のゲームであることは皆知っています私たちはそれらを訓練することについてかなり多くのことを知っていますそれほどまでに進化しています...
「Google.orgの新しい助成金は、永久凍土の融解を追跡するのに役立ちます」
新たな500万ドルの助成金は、Woodwell Climate Research Centerが北極の永久凍土の解凍をほぼリアルタイムで追跡するのを支援することを目的としています
「DISCOに会おう:人間のダンス生成のための革新的なAI技術」
生成AIは、コンピュータビジョンのコミュニティで大きな関心を集めています。テキストに基づく画像およびビデオ合成の最近の進歩(Text-to-Image(T2I)およびText-to-Video(T2V)など)、拡散モデルの登場により、顕著な忠実度と生成品質が示されました。これらの進歩は、画像およびビデオの合成、編集、アニメーションの潜在能力を示しています。ただし、合成された画像/ビデオは、特に人間中心の人間ダンス合成などの人間ダンス合成の歴史が長いにもかかわらず、合成されたコンテンツと現実世界のダンスシナリオの間には大きなギャップがあります。 Generative Adversarial Networks(GAN)の時代から、研究者は、ソースビデオからターゲット個人にダンス動作を転送するためのビデオからビデオへのスタイル変換を拡張するために、しばしばターゲット人物への人間特有の微調整を必要とします。 最近の一連の研究では、事前にトレーニングされた拡散ベースのT2I/T2Vモデルを使用して、テキストプロンプトに基づいてダンス画像/ビデオを生成することが提案されています。このような粗い制御条件は、ユーザーが予想される主題(人間の外観)やダンスの動き(人間のポーズ)を正確に指定することをほとんど不可能にします。 ControlNetの導入により、ジオメトリヒューマンキーポイントとのポーズ制御を組み合わせることで、この問題が部分的に緩和されますが、テキストプロンプトに依存するため、制御ネットがリファレンスイメージの人間の外観などの豊かな意味の一貫性を確保できるかどうかは明確ではありません。さらに、限られたダンスビデオデータセットでトレーニングされたほとんどすべての既存の手法は、限られた主体属性または極度に単純化されたシーンと背景のいずれかに苦しんでいます。これは、人間の主体、ポーズ、および背景の未知の組成に対するゼロショットの一般化能力が低くなる原因となります。 ユーザー固有のショートビデオコンテンツ生成などの現実のアプリケーションをサポートするためには、人間のダンス生成は実世界のダンスシナリオに準拠する必要があります。したがって、生成モデルは、以下の特性を持つ人間のダンス画像/ビデオを合成することが期待されています:忠実度、一般化能力、および合成性。 生成された画像/ビデオは、参照画像と一貫性のある人間の主体と背景の外観を保持しながら、提供されたポーズを正確に追従することによって、忠実度を示すべきです。モデルはまた、ユーザー固有の微調整を必要とせずに、未知の人間の主体、背景、およびポーズを扱うことによって、一般化能力を示すべきです。最後に、生成された画像/ビデオは、異なる画像/ビデオから取得された人間の主体、背景、およびポーズの任意の組み合わせを可能にする合成性を示すべきです。 この点において、DISCOと呼ばれる画期的なアプローチが提案されています。DISCOのアプローチの概要は、以下の図に示されています。 https://arxiv.org/abs/2307.00040 DISCOは、改善された忠実度と合成性のための分離制御を持つ画期的なモデルアーキテクチャと、より優れた一般化能力のための人間属性事前トレーニングという2つの主要な設計を組み合わせています。DISCOの画期的なモデルアーキテクチャは、生成されたダンス画像/ビデオが望ましい人間の主体、背景、およびポーズを忠実に捉える一方で、これらの要素の柔軟な組み合わせを可能にします。さらに、分離制御は、モデルが忠実な表現を維持し、多様な組成を受け入れる能力を向上させます。さらに、DISCOは、人間属性の事前トレーニング戦略を使用して、モデルの一般化能力を強化します。この事前トレーニング技術により、モデルは未知の人間属性を処理する能力を備えるため、トレーニングデータの制限を超えた高品質のダンスコンテンツを生成することができます。全体として、DISCOは、洗練されたモデルアーキテクチャと革新的な事前トレーニング戦略を組み合わせた包括的なソリューションを提供し、現実のダンスシナリオでの人間のダンス生成の課題に効果的に対処します。 以下に結果を示し、人間のダンス生成の最新技術とDISCOとの比較を行います。 https://arxiv.org/abs/2307.00040 これはDISCOの要約です。DISCOは、人間のダンスを生成するための新しいAI技術です。興味があり、この研究についてもっと詳しく知りたい場合は、以下のリンクをクリックしてさらなる情報を見つけることができます。
Google at ACL 2023′ ACL 2023におけるGoogle
Posted by Malaya Jules, Program Manager, Google 今週、自然言語処理と理解のリーダーであり、ACL 2023のダイヤモンドレベルスポンサーであるGoogleでは、50以上の研究発表と、さまざまなワークショップやチュートリアルへの積極的な参加を通じて、この広範な研究領域を紹介いたします。 ACL(Association for Computational Linguistics)は、自然言語に対する計算的手法に関連する幅広い研究分野をカバーする一流の会議であり、オンラインで開催されています。 ACL 2023に登録されている場合、Googleブースにお立ち寄りいただき、数十億人のために興味深い問題を解決するためにGoogleで行われているプロジェクトについて詳しくお知りください。以下でGoogleの参加についてもっと詳しく知ることもできます(Googleの関連情報は太字で表示されます)。 理事会および組織委員会 エリアチェアは、Dan Garrette、ワークショップチェアは、Annie Louis、パブリケーションチェアは、Lei Shu、プログラム委員会には、Vinodkumar Prabhakaran、Najoung Kim、Markus Freitagが含まれます。 注目論文…
「ACL 2023でのGoogle」
投稿者: Malaya Jules、プログラムマネージャー、Google 今週、自然言語処理に関する計算言語学の第61回年次総会(ACL)がオンラインで開催されます。ACLは、自然言語に対する計算的アプローチに関心のある広範な研究分野をカバーする主要な学会です。 自然言語処理と理解のリーダーであり、ACL 2023のダイヤモンドレベルのスポンサーであるGoogleは、50以上の研究発表とさまざまなワークショップやチュートリアルへの積極的な参加とともに、この分野の最新の研究を紹介します。 ACL 2023に登録されている場合、Googleブースにぜひお立ち寄りいただき、何十億もの人々のために興味深い問題を解決するためのGoogleのプロジェクトについて詳しく学んでいただければと思います。以下でGoogleの参加についてもっと詳しく知ることもできます(Googleの関連情報は太字で表示されます)。 ボードと組織委員会 エリアチェアには、Dan Garrette、ワークショップチェアには、Annie Louis、発表チェアには、Lei Shu、プログラム委員には、Vinodkumar Prabhakaran、Najoung Kim、Markus Freitagが含まれています。 注目論文 NusaCrowd: インドネシアNLPリソースのオープンソースイニシアチブ Samuel Cahyawijaya, Holy Lovenia, Alham…
GoogleがACL 2023に参加します
Posted by Malaya Jules, Program Manager, Google 今週、計算言語学協会(ACL)の第61回年次総会がオンラインで開催されています。ACLは、自然言語に関する計算手法に関連する広範な研究分野をカバーする一流のカンファレンスです。 自然言語処理と理解のリーダーであり、ACL 2023のダイヤモンドレベルスポンサーであるGoogleは、50以上の論文を発表し、様々なワークショップやチュートリアルに積極的に参加することで、この分野での最新の研究を紹介します。 ACL 2023に登録されている場合、Googleブースにぜひ訪れ、数十億人の人々のために興味深い問題を解決するためにGoogleで行われているプロジェクトについて詳しく学んでください。以下でGoogleの参加についてもっと詳しく学ぶこともできます(Googleの関連組織は太字で示されています)。 理事会および組織委員会 エリアチェアには:Dan Garrette、ワークショップチェアには:Annie Louis、出版チェアには:Lei Shu、プログラム委員会には:Vinodkumar Prabhakaran、Najoung Kim、Markus Freitagが含まれます。 注目論文 NusaCrowd:Indonesian NLPリソースのオープンソースイニシアティブ Samuel…
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.