「CVPR 2023のメモ」

CVPR 2023 Memo

カナダプレイス周辺の数日間….

CVPR 2023 at Vancouver Convention Center. Source: author

私は幸運にも2023年6月18日から22日まで、バンクーバーのバンクーバーコンベンションセンターで開催されたコンピュータビジョンとパターン認識の主要なカンファレンスであるCVPRに参加する機会を得ました。興味深いワークショップ、チュートリアル、セッションがたくさんありましたが、ときには並行して開催されていました。私はたくさんのことを学び、会後にいくつかの論文やビデオを調べています。この記事では、いくつかの内容を共有します。

すべてのViTs:ビジョンにおける注意の理解と解釈

これはHila CheferとSayak Paulによって非常にわかりやすく説明されたチュートリアルでした。Hilaは注意/トランスフォーマーの解釈可能性に関する幅広い研究を行っており、素晴らしいスピーカーです。個人的には、彼女の研究は本当に重要だと思います。なぜなら、ほとんどのAI実践者がトランスフォーマーの内部動作を理解し、結果を解釈することができないからです。それは彼らが適切なツールセットを持っていないためです。Hilaの研究は、将来のあらゆるものであるトランスフォーマーベースのモデルのより良い理解へのゲートウェイとなることができます。詳細:https://all-things-vits.github.io/atv/

ワークショップ:長尺ビデオの理解と生成

このワークショップでは、私の仕事に関連するいくつかの興味深い課題があります。例えば、ビデオイベントの境界検出、イベント境界のキャプション付けなどです。私は上記のチュートリアルに参加していたため、このワークショップには参加できませんでしたが、将来の参考のために言及しておきたいと思います。詳細については、https://sites.google.com/view/loveucvpr23をご覧ください。

ワークショップ:マルチモーダル設定におけるオープンドメインの推論

Deepmind Flamingo論文の共著者であるKarel Lencが、Flamingoにおける大規模言語モデルの評価とトレーニングに関する彼の研究を共有しました。Karelはモデルのアーキテクチャー、デコーダーのみのトランスフォーマーベースのネットワークを共有しました。Flamingoのビジュアル処理はCLIPと似ていますが、ViTの代わりにNFNetを使用しており、ネットワークからプーリングレイヤーを削除し、画像特徴ベクトルと直接作業します。ビジュアル処理の中には、「Perceiver Resampler」という新しいリサンプリング技術が提案されています。彼らはまた、新しい「ゲート付きクロス…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「Adam Ross Nelsonによる自信のあるデータサイエンスについて」

データサイエンスの中で新たな分野が現れ、研究内容が理解しにくい場合は、専門家や先駆者と話すのが最善です最近、私たちは...

人工知能

Aaron Lee、Smith.aiの共同設立者兼CEO - インタビューシリーズ

アーロン・リーさんは、Smith.aiの共同創業者兼CEOであり、AIと人間の知性を組み合わせて、24時間365日の顧客エンゲージメン...

人工知能

「15Rockの共同創業者兼CEO、ガウタム・バクシ氏によるインタビューシリーズ」

「ガウタム・バクシは、気候リスク管理とアドバイザリーサービスのグローバルリーダーである15Rockの共同創設者兼CEOですガウ...

人工知能

「ゲイリー・ヒュースティス、パワーハウスフォレンジクスのオーナー兼ディレクター- インタビューシリーズ」

ゲイリー・ヒュースティス氏は、パワーハウスフォレンジックスのオーナー兼ディレクターであり、ライセンスを持つ私立探偵、...

データサイエンス

「3つの質問:ロボットの認識とマッピングの研磨」

MIT LIDSのLuca CarloneさんとJonathan Howさんは、将来のロボットが環境をどのように知覚し、相互作用するかについて議論し...

人工知能

「トリントの創設者兼CEO、ジェフ・コフマンへのインタビューシリーズ」

ジェフ・コーフマンは、ABC、CBS、CBCニュースで30年のキャリアを持った後、Trintの創設者兼CEOとなりましたジェフは手作業の...