Learn more about Search Results A - Page 776

「ニューラルネットワークとディープラーニング:教科書(第2版)」

『ニューラルネットワークと深層学習』の第2版が現在利用可能ですこの本は、深層学習の古典的なモデルと現代的なモデルの両方をカバーしていますこの本は大学の教科書として意図されており、深層学習の理論とアルゴリズムの側面をカバーしています第2版は…

「プライバシーの懸念と激化する競争の中、バードがヨーロッパとブラジルに初上陸」

アルファベット社(Googleの親会社)は、AIチャットボットのBardをヨーロッパとブラジルに展開することで、AIの世界における活動を広げていますこの拡大は、Bardが3月に英国と米国で導入されて以来、最も大きな成長を示しており、マイクロソフトのAIチャットボットChatGPTとの競争が激化しています生成AIモデル[…]

「SegGPT」にお会いください:コンテキスト推論を通じて画像または動画の任意のセグメンテーションタスクを実行する汎用モデル

コンピュータビジョンでは、前景、カテゴリ、オブジェクトインスタンスなどの重要な概念をピクセルレベルで特定し、再構成することを目指しており、セグメンテーションは最も基本的な課題の1つです。前景セグメンテーション、インタラクティブセグメンテーション、意味的セグメンテーション、インスタンスセグメンテーション、パノプティックセグメンテーションなどのさまざまなセグメンテーションタスクについて、近年、かなりの進展がありました。ただし、これらの専門的なセグメンテーションモデルは、特定のタスク、分類、粒度、データ形式などに制約があります。新しい環境に適応する際に、例えば新しい概念をセグメンテーションしたり、写真ではなくビデオ内のオブジェクトをセグメンテーションする場合、新しいモデルをトレーニングする必要があります。 この研究では、無限のセグメンテーションタスクに対応できる単一のモデルをトレーニングすることを目標としています。これには時間のかかる注釈作業が必要であり、多くのセグメンテーションジョブに対して持続可能性が求められます。主な難点は2つの領域にあります:(1)部分、意味的、インスタンス、パノプティック、人物、医療画像、航空画像など、非常に異なるデータタイプをトレーニングに組み込むこと。(2)従来のマルチタスク学習とは異なる一般化可能なトレーニングスキームを作成することであり、タスクの定義が柔軟で、自身の範囲外のタスクを処理できるものです。これらの問題を克服するために、北京アカデミー、浙江大学、北京大学の研究者は、セグモデルを紹介し、文脈内で何でもセグメンテーションするための一般化パラダイムを提案しています。 彼らは、多くのセグメンテーションタスクを一般化した文脈内学習フレームワークに統合し、セグメンテーションを視覚知覚の一般的な形式と見なしています。このフレームワークは、それらを同じ画像形式に変換することで、さまざまなセグメンテーションデータタイプを処理できます。各データサンプルに対してランダムな色マッピングを使用することで、SegGPTトレーニング問題は文脈内の着色問題として表現されます。クラス、オブジェクトインスタンス、コンポーネントなどの関連領域のみを文脈によって色付けすることが目標です。ランダムな着色スキームを使用することで、モデルは特定の色合いに依存するのではなく、与えられたジョブを実行するために文脈データを参照する必要があります。これにより、より適応性と一般性のある方法でトレーニングにアプローチすることが可能になります。 標準のViTと単純なスムーズなl1損失を使用する場合、残りのトレーニングコンポーネントは同じままです。トレーニング後、SegGPTはコンテキスト内推論を使用して、オブジェクトインスタンス、スタッフ、部分、輪郭、テキストなどのいくつかのインスタンスを指定した画像やビデオでさまざまなセグメンテーションタスクを実行することができます。彼らは、マルチ例示のシナリオでモデルが利用できるようにするためのシンプルでパワフルなコンテキストアンサンブルテクニックであるフィーチャーアンサンブルを提案しています。ADE20Kセマンティックセグメンテーションなどの特定のユースケースにカスタマイズされたプロンプトを調整することで、SegGPTはモデルパラメータを変更することなく専門モデルとしても簡単に機能することができます。 これらが彼らの主な貢献です。 (1)初めて、幅広いセグメンテーションタスクを自動的に完了する単一の一般モデルを示しています。 (2)セマンティックセグメンテーション、ビデオオブジェクトセグメンテーション、意味的セグメンテーション、パノプティックセグメンテーションなどのさまざまなタスクについて、事前トレーニングされたSegGPTを微調整せずに直接評価します。 (3)主観的および統計的に、彼らの結果は、ドメイン内外のターゲットをセグメンテーションする能力を示しています。ただし、彼らの研究は、あらゆるベンチマークで新たな最先端の結果を達成することや、既存の専門的なアプローチを凌駕することを約束するものではありません。一般的なモデルは、特定のタスクを処理できない場合があると考えているためです。

「識別可能であるが可視性がない:プライバシー保護に配慮した人物再識別スキーム(論文要約)」

人物再識別(Person Re-ID)は、異なる場所や時間で監視カメラを使用して人々を識別するための高度なコンピュータビジョンの手法です。個人の画像を使用することは、セキュリティと公共の安全性を向上させる巨大なポテンシャルがあるにもかかわらず、重要なプライバシー上の懸念を引き起こします。個々の画像は、データプライバシーに関する法律や規制の下ではプライベート情報として扱われるため、これらの問題にはプライバシーを保護する解決策が必要です。 プライバシーを保護するための既存の人物再識別手法には、特定の制限があります。従来の暗号化方法は強力なプライバシー保証を提供しますが、暗号化されたデータ上での計算を許可しません。同様に、ホモモーフィック暗号化(HE)は、クラウドサーバが計算結果にアクセスできないようにする一方で、暗号文上での計算を直接サポートします。さらに、浮動小数点特徴ベクトルの暗号化に関する既存の暗号化メカニズムは、デコードエラーや計算エラーが発生する問題があります。 最近、新しい記事が公開され、FREEDと呼ばれる新しいプライバシー保護型の人物再識別ソリューションが提案されました。このシステムは、暗号化された特徴ベクトルの類似度メトリックスとしてプライバシー保護型の人物再識別を定式化し、クラウドサーバが個人の画像プライバシーを危険にさらすことなく、再識別操作を実行できるようにします。 具体的には、FREEDは、新しいエンコーディングメカニズムと安全なバッチ計算プロトコルを利用して、浮動小数点特徴ベクトルを暗号化し、再識別操作を効果的に実行します。 FREEDは、プロセス中に特徴ベクトルのプライバシーを保護するために3つの主要なコンポーネントを導入しています: エンコーディングメカニズム(ECMO)は、浮動小数点特徴ベクトルを整数に変換し、正確性を確保しデコードエラーを回避します。 セキュアバッチ乗算(BatchSMUL)プロトコルは、暗号化された特徴ベクトルの類似度メトリックスを効率的に計算し、計算コストを削減します。 セキュアバッチ部分復号(BatchPDec)プロトコルは、類似度メトリックスを安全にランク付けし、個別のプライバシーを損なうことなく正確な人物再識別を可能にします。 これらのコンポーネントは、人物再識別タスクの堅牢なプライバシー保護ソリューションを提供します。 ECMOを使用して浮動小数点特徴ベクトルを整数に変換することで、2つの主要な利点が得られます。まず第一に、他のエンコーディング手法で一般的に遭遇するデコードエラーを排除します。ECMOは、暗号化と復号化後の元の特徴ベクトルのより正確な取得を保証し、その忠実度を保持し、人物再識別の正確性を向上させます。第二に、この整数への変換は、従来の手法と比較して、計算エラー率と暗号化コストを大幅に削減します。ECMOのより効率的で正確なプロセスにより、スキーム全体の正確性と実用性が向上します。 テストでは、計算および通信費用の面で、FREEDの効率がよく使用される手法であるMGNと比較されました。ECMOは、他のエンコーディング技術と比較して、エラーレートの著しい減少が示されました。また、制御パラメータの設定も確立されました。FREEDは、計算と通信の面で既存のプロトコルよりも優れた安全かつ実用的な人物再識別方法を提供しました。 結論として、この記事では、FREEDという新しい革新的かつ効果的なプライバシー保護型の人物再識別ソリューションが提示されています。エンコーディングメカニズム(ECMO)を活用して浮動小数点特徴ベクトルを整数に変換することで、FREEDは従来のエンコーディング手法の制限に対処し、正確性を向上させ、計算および計算エラーを削減します。セキュアバッチ乗算(BatchSMUL)およびセキュアバッチ部分復号(BatchPDec)プロトコルは、システムの効率を向上させます。幅広い実験的評価を通じて、FREEDはMGNなどの手法と比較してその効果と効率性を実証しました。全体的に、FREEDは高い正確性と実用性を維持しながら、人物再識別におけるプライバシーの課題に取り組む有望な手法を提供します。

「2023年の機械学習モデルにおけるトップな合成データツール/スタートアップ」

実際の出来事の結果ではなく、意図的に作成された情報は、合成データとして知られています。合成データはアルゴリズムによって生成され、機械学習モデルのトレーニング、数学モデルの検証、テストプロダクションや運用データのテストデータセットの代替として使用されます。 合成データを使用する利点は、プライベートまたは制御されたデータを使用する際の制約の緩和、正確なデータでは満たせない特定の状況にデータ要件を調整すること、DevOpsチームがソフトウェアテストや品質保証に使用するためのデータセットを生成することなどです。 元のデータセットの複雑さを完全に複製しようとする際の制約は、不一致につながる可能性があります。実用的な合成例を生成するには、正確で正確なデータが依然として必要であるため、正確なデータを完全に代替することは不可能です。 合成データの重要性 ニューラルネットワークをトレーニングするために、開発者は広範で細心の注意を払ったデータセットが必要です。AIモデルは通常、より多様なトレーニングデータを持っているほど正確です。 問題は、数千から数百万のアイテムを含むデータセットを編集し、識別するのに多くの労力がかかり、頻繁に手頃な価格ではないことです。 ここで偽のデータが登場します。AI.Reverieの共同創設者であるPaul Walborsky氏は、ラベリングサービスから6ドルかかる単一の画像を、6セントで合成的に生成できると考えています。 お金を節約することは始まりに過ぎません。Walborsky氏は、「合成データは、プライバシーの懸念や偏見を減らすため、現実世界を正確に反映するためのデータの多様性を確保することが重要です。」と述べています。 合成データセットは、時には現実のデータよりも優れている場合があります。合成データは自動的にタグ付けされ、意図的に一般的ではないが重要な特殊な状況を含めることができます。 合成データのスタートアップおよび企業のリスト Datagen イスラエルの企業Datagenは2018年に設立され、2,200万ドルの資金調達を行っています。そのうち1,850万ドルのシリーズAが2月に行われ、その時が同社の公式な登場の機会でした。Datagenは、人間の動きに明らかな専門知識を持ち、フォトリアリスティックな視覚シミュレーションと自然界の再現に特化しており、その特異な合成データを「シミュレートデータ」と呼んでいます。Datagenは、合成データを扱う多くの他の企業と同様に、生成的敵対的ネットワーク(GAN)というAI手法を使用しています。これは、2つのシステム間のコンピューター将棋のようなものであり、一方が架空のデータを生成し、他方が結果の真実性を評価します。Datagenは、GANを物理シミュレーターと組み合わせ、強化学習ヒューマノイドモーションテクニックとスーパーレンダリングアルゴリズムを使用しています。 Datagenは、小売業、ロボット工学、拡張現実、仮想現実、モノのインターネット、自動運転車など、様々な産業をターゲットにしています。例えば、Amazon Goの場所のような小売自動化では、コンピュータービジョンシステムが買い物客を監視して、誰もが不正行為をしないことを確認しています。 Parallel Domain 自動運転車のための環境シミュレーションは、現在最も一般的なユースケースの1つです。それがSilicon ValleyのスタートアップであるParallel Domainの主要な事業領域です。Parallel Domainは2017年に設立され、その後約1,390万ドルの資金調達を行っています。その中には、昨年末の1,100万ドルのシリーズAも含まれています。トヨタはおそらく最大の支援者および顧客です。Parallel Domainは、合成データプラットフォームを使用して自動運転車に人々を殺すことを避ける方法を教えるために、最も困難なユースケースに焦点を当てています。最近の開発では、トヨタリサーチインスティチュートとのパートナーシップにより、合成データを使用して物体の恒久性について自律システムに教えています。現在の認識システムは、Parallel Domainのおかげで一時的に消える場合でもオブジェクトを追跡できるようになりましたが、まだpeek-a-booのようなものです。さらに、同社は完全に注釈付きの合成カメラとLiDARデータセットのデータビジュアライザを一般に公開しています。同社は、自律型ドローンデリバリーや自動運転のための人工的なトレーニングデータも提供しています。 Mindtech…

コードの解読:機械学習が故障診断と原因分析の秘密を明らかにする

機械学習アルゴリズムは、リアルタイムでの効率的な問題解決のために、予知的な故障診断、問題の予測、および根本原因の解明を可能にします

GoogleがNotebookLMを導入:あなた専用の仮想研究アシスタント

Googleは、Google Labsから最新の実験的な提供であるNotebookLMを発表しています。以前はProject Tailwindとして知られていたこの革新的なメモソフトウェアは、言語モデルの力を活用することで情報の統合方法を革新しようとしています。NotebookLMを使用することで、Googleはユーザーが選択したソースに基づいてより速くつながりを見つけ、重要な洞察を得るのを支援することを目指しています。この仮想研究アシスタントの機能とポテンシャルについて詳しく見ていきましょう。 また読む:Google I/O 2023で何が起こったのか? 情報に圧倒されていますか?NotebookLMが助けになります! 現代のデータ駆動型の世界では、人々は膨大な情報を管理するという課題に直面しています。この問題に対処するため、Googleは学生、教授、知識労働者との研究と議論を開始しました。その目標は、複数のソースから事実やアイデアを効率的に統合するための効果的な方法を特定することでした。NotebookLMは、情報過多の中でユーザーが迅速につながりを見つけるのを支援する有望な解決策として浮かび上がりました。 また読む:AudioPaLMの紹介:Googleの言語モデルのブレイクスルー NotebookLMでより速くつながりを探索する 実験的な製品であるNotebookLMは、言語モデルの可能性と既存のコンテンツを活用して貴重な洞察を提供します。選択したソースに基づいて事実を要約し、複雑なアイデアを説明し、新しいつながりを生成するバーチャル研究アシスタントを想像してみてください。この機能により、ユーザーは選択した資料により深く入り込むことができ、時間と労力を節約することができます。 また読む:Google AIのDIDACTがソフトウェア開発を永遠に変える ソースグラウンディングでAIアシスタントをパーソナライズ 従来のAIチャットボットとは異なり、NotebookLMは「ソースグラウンディング」というユニークな機能を提供しています。ノートと選択したソースで言語モデルをグラウンディングすることで、あなたにとって最も重要な情報に精通したパーソナライズされたAIアシスタントを作成します。最初は、お好みの特定のGoogleドキュメントでNotebookLMをグラウンディングすることができます。追加の形式にも対応予定です。 NotebookLMの力を解き放て GoogleドキュメントをNotebookLMと統合した後、さまざまな強力な機能を利用できます: 要約とキーコンテンツの取得Googleドキュメントを追加すると、メモソフトウェアが自動的に要約を生成し、キーコンテンツを強調表示し、理解を深めるための質問を提案します。この機能により、重要な洞察を素早く把握できる包括的な概要が提供されます。 詳細な分析のための質問より深く掘り下げる準備ができたら、NotebookLMを使用してアップロードしたドキュメントに質問することができます。神経科学用語の用語集を求める医学生や、歴史的な人物の相互作用を研究している作家など、必要な回答を見つけるのにNotebookLMがお手伝いします。 創造的なアイデアの生成NotebookLMはシンプルなQ&Aを超えて広がります。ビデオのインスピレーションを求めるコンテンツクリエーターであるか、潜在的な投資家の質問を探している起業家であるかに関わらず、NotebookLMはあなたの想像力をかき立て、イノベーションを促進することができます。 事実チェックとソースの引用 NotebookLMのソースグラウンディングにより、誤情報のリスクが低減されますが、AIの応答をソース資料と照らし合わせて事実チェックすることは重要です。Googleは正確さの重要性を理解しており、各応答に引用を含め、選択したソースから関連する引用を提示します。これにより、責任ある使用が確保され、研究の信頼性が維持されます。 また読む:PoisonGPT:Hugging Face…

「6人の女性が気候変動との戦いをリードしている」

「私たちは、気候科学のパイオニアであるユニス・ニュートン・フット博士と、女性が率いるGoogle.orgの6つの恩恵を受ける組織に敬意を表します彼らはより持続可能な未来を築いています」

気候変動との戦いをリードする6人の女性

「私たちは気候科学の先駆者であるユニス・ニュートン・フートと、より持続可能な未来を築く6人の女性主導のGoogle.orgの助成金受給者を祝っています」

「Google.orgの新しい助成金は、永久凍土の融解を追跡するのに役立ちます」

新たな500万ドルの助成金は、Woodwell Climate Research Centerが北極の永久凍土の解凍をほぼリアルタイムで追跡するのを支援することを目的としています

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us