Learn more about Search Results A - Page 255

Googleの研究者たちは、RO-ViTを紹介しますこれは、オープンボキャブラリー検出の改善のため、リージョンに意識を向けた方法でビジョントランスフォーマーを事前トレーニングするためのシンプルなAI手法です

最近の進歩により、コンピュータは人間の視覚のように、世界から視覚情報を解釈し理解することができるようになりました。画像と動画から情報を処理、分析、抽出することを含みます。コンピュータビジョンは、視覚解釈を必要とするタスクの自動化を実現し、手作業の介入を減らすことができます。オブジェクト検出は、画像やビデオフレーム内の複数の興味深いオブジェクトを識別し、位置を特定するコンピュータビジョンのタスクです。 オブジェクト検出は、シーン内に存在するオブジェクトを判別し、それらが画像内のどこに位置しているかに関する情報を提供することを目指しています。ほとんどの現代のオブジェクト検出器は、領域とクラスラベルの手動注釈に依存していますが、これにより語彙サイズが制限され、さらなるスケーリングが高価になります。 代わりに、画像レベルの事前学習とオブジェクトレベルのファインチューニングのギャップを埋めるために、ビジョン-言語モデル(VLM)を使用することができます。ただし、そのようなモデルの事前学習プロセスでオブジェクト/領域の概念を適切に活用する必要があります。 Google Brainの研究者らは、画像レベルの事前学習とオブジェクトレベルのファインチューニングのギャップを埋めるためのシンプルなモデルを提案しています。彼らは、領域に意識を持たせたオープンボキャブラリービジョントランスフォーマー(RO-ViT)を提案しています。 RO-ViTは、オープンボキャブラリーオブジェクト検出のために、ビジョントランスフォーマーを領域に意識した方法で事前学習するためのシンプルな手法です。通常の事前学習では、画像全体の位置埋め込みが必要ですが、研究者は、全画像の位置埋め込みの代わりに、ランダムに領域の位置埋め込みを切り取り、リサイズすることを提案しています。これを「切り取られた位置埋め込み」と呼びます。 研究チームは、焦点損失を使用した画像テキストの事前学習が既存のソフトマックスCE損失よりも効果的であることを示しています。また、さまざまな新しいオブジェクト検出技術も提案しています。彼らは、既存のアプローチでは、オブジェクトの候補のステージで新しいオブジェクトを見逃すことがよくあると主張しています。なぜなら、候補はよりバランスが取れる必要があるからです。 チームは、モデルRO-ViTが最先端のLVISオープンボキャブラリー検出ベンチマークを達成していると述べています。その統計によると、イメージテキスト検索ベンチマークの12メトリックのうち9つでそれを達成しているとのことです。これは、学習された表現が領域レベルで有益であり、オープンボキャブラリー検出で非常に効果的であることを反映しています。 オブジェクト検出技術の進歩に伴い、責任ある開発、展開、規制が重要になります。その正の影響を最大化し、潜在的なリスクを軽減するためです。全体として、オブジェクト検出技術の持続的な進歩は、産業の革新、安全性と生活の質の向上、かつてはSFと考えられていたイノベーションを実現することによって、より明るい未来に貢献することが期待されています。 論文とGoogleブログをチェックしてください。この研究に関しては、このプロジェクトの研究者によるものです。また、最新のAI研究ニュース、クールなAIプロジェクトなどを共有している29k+のML SubReddit、40k+のFacebookコミュニティ、Discordチャンネル、Emailニュースレターにもぜひ参加してください。 私たちの業績が気に入ったら、ニュースレターも気に入るでしょう。 この記事はMarkTechPostで最初に公開されました。Googleの研究者は、オープンボキャブラリー検出を改善するために、リージョンに意識した方法でビジョントランスフォーマーを事前学習する単純なAI手法、RO-ViTを紹介しました。

「世界中のさらに多くの人々に生成型AIを検索にもたらす」

「我々は、より多くの人々にSearch(SGE)での生成的AI機能を提供し、Search Labsをインドと日本で利用可能にしています」

「Amazon LexとAmazon Kendra、そして大規模な言語モデルを搭載したAWSソリューションのQnABotを使用して、セルフサービス型の質問応答を展開してください」

「Amazon Lexによるパワーを利用したAWSのQnABotソリューションは、オープンソースのマルチチャネル、マルチ言語の会話型チャットボットですQnABotを使用すると、自己サービスの会話型AIを迅速にコンタクトセンター、ウェブサイト、ソーシャルメディアチャネルに展開することができ、コストを削減し、ホールド時間を短縮し、顧客体験とブランドの評価を向上させることができますこの記事では、QnABotの新しい生成型AI機能を紹介し、これらの機能を使用するためのチュートリアルを作成、展開、カスタマイズする方法について説明しますまた、関連するユースケースについても議論します」

VoAGIニュース、8月30日:Generative AIで構築された7つのプロジェクト • NumpyとPandasを超えて:あまり知られていないPythonライブラリ

「ジェネラティブAIを用いた7つのプロジェクト • NumpyとPandasを超えて:知名度の低いPythonライブラリの可能性を引き出す • データサイエンスにおけるChatGPTのコードインタプリタの5つの活用方法 • GPT-4 8つのモデルを1つに;秘密が明らかに」

「AIの襲撃を生き残る5つの収益性の高い小規模ビジネス」

「人工知能(AI)のエキサイティングで予測不可能な世界では、この技術がさまざまなビジネスに与える影響についての懸念が残っています確かに、特定のセクターは自動化に脆弱であり、仕事の置き換えへの恐れが引き起こされていますしかし、この不確実性の中で、一部のビジネスは強靭さを持ち、さらなる成長の可能性を秘めていますもしもあなたが・・・AIの襲撃を生き抜くことができる5つの利益の上がる小規模ビジネス 記事を読む»」

「2023年のトップ12のAI音楽生成器」

AI音楽生成は、人工知能の技術を使用して音楽を生成するプロセスです。AIのアルゴリズムは、既存の音楽からパターン、構造、スタイルを調査することによって、新しいトラックの作品を自律的に生成することができます。この技術は、音楽の作曲、制作、楽しむ方法を革新する可能性があります。AI音楽技術は、革新的な機会を探求するための多くの構造とツールを持つ急速に進化する分野です。 AI音楽生成とは何ですか? AI音楽生成は、人工知能(AI)の技術を使用して音楽を生成することを指します。これには、既存の音楽の大規模なデータセットに対してアルゴリズムを訓練し、パターン、構造、スタイルを分析する作業が含まれます。訓練されたアルゴリズムは、しばしば直接的な人間の介入なしで、メロディやハーモニーから完全なトラックまで、オーセンティックな音楽作品を生成することができます。AI音楽生成は、音楽の創造性を高め、作曲家やプロデューサーを支援し、新しい音楽のアイデアを探求するのに貢献することができます。 さらに読む:AIによる音楽生成の世界を探索する トップ12のAI音楽生成ツール 1. MusicLM – Googleのテキストから音楽を生成するツール MusicLMは、Google AIによって開発されたテキストから音楽を生成するAI音楽生成モデルです。このモデルは、ユーザーが提供した説明に基づいてオリジナルで本物の音楽を生成することを目的としています。このAI音楽生成ツールは、ユーザーが提供した説明に音楽形式で応答することができます。 特徴 この音楽AI生成ツールは、テキストやコードの大量の分析に優れた大規模言語モデルに基づいています。 単語や文の間のパターンや関係を認識する能力があります。 価格の詳細 利用は無料ですが、登録が必要であり、需要が高いため、利用可能なアクセスが提供されます。 ステップガイド Google Labにアクセスするには、https://labs.withgoogle.com を訪問します。 自国でウェブサイトが利用できない場合は、代わりにVPNを使用します。 ホームページでMusicLMをクリックします。 生成したい音楽の説明を入力バーに追加します。 入力データを入力した後、AIツールが制御を引き継ぎ、要求された音楽を生成します。…

「2030年までに注目すべき7つの先駆的なAIの仕事」

「ChatGPTや一般的なLLMのような生成型AIは、多くの仕事を取って代わる一方で、刺激的な新しい仕事も生み出します将来においてどのような仕事が関連性を持つのでしょうか?」

「リアルタイムデータのためのPythonでのChatGPT APIの使用方法」

「ChatGPTが未知のトピックに回答するようにしたいですか? ここでは、わずかなコード行でAIパワードのアプリを構築する方法について、ステップバイステップのチュートリアルをご紹介します」

「AWS 上の生成型 AI を使用して、放射線学のレポートの所見から自動的に印象を生成します」

この投稿では、AWSサービスを使用して、公開されているLLMsを放射線学報告の要約のために微調整する戦略を示していますLLMsは、自然言語の理解と生成において卓越した能力を示しており、さまざまなドメインやタスクに適応できる基礎モデルとして機能します事前学習済みモデルを使用することには、重要な利点があります計算コストを削減し、炭素フットプリントを削減し、ゼロからモデルをトレーニングする必要がなく、最先端のモデルを使用できます

「成長著しいブルーエコノミーにおけるAIの役割」

「ブルーエコノミーは社会の重要な役割を果たしています多くの人々の生計は海洋に依存しています人工知能の導入により、この概念が表す使命を果たすための重要なツールとして機能することができますブルーエコノミーとは何か?ブルーエコノミーは2012年に初めて紹介されましたが、まだ多くの人々が理解する必要があります...」

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us