「非営利研究者による人工知能(AI)の進展リスト」

『美容とファッションの分野における人工知能(AI)の進展リスト』

去年遅くから今年にかけて、2023年はAIの人々がAIアプリケーションを作成するのに最適な時期であり、これは非営利の研究者によるAIの進歩リストのおかげです。以下にそのリストを示します。

ALiBi

ALiBiはTransformersにおけるテキストの推測問題に効率的に取り組む方法であり、学習に使用されたものよりも長いテキストシーケンスを推測する際に適用されます。ALiBiは実行時間に影響を与えず、追加のパラメータも必要とせず、既存のTransformerコードの数行を変更するだけで推測を行うことができる実装が容易なメソッドです。

Scaling Laws of RoPE-based Extrapolation

この方法は、Transformerの推測能力を向上させるためのフレームワークです。研究者は、Rotary Position Embedding(RoPe)ベースのLLMを事前学習の文脈長でより小さなまたは大きなベースで微調整すると、より良いパフォーマンスが得られることを発見しました。

FlashAttention

Transformersは、テキスト情報を処理できる強力なモデルですが、大規模なテキストシーケンスで作業する場合には大量のメモリが必要とされます。FlashAttentionは、既存の基準よりも高速でTransformerをトレーニングする、入出力(IO)を考慮したアルゴリズムです。

Branchformer

Conformers(Transformerの一種)は音声処理に非常に効果的です。それらは畳み込み層とセルフアテンション層を順次使用するため、そのアーキテクチャは解釈しづらいものとなっています。Branchformerは、エンコーダの代替手法であり、柔軟で解釈可能であり、エンドツーエンドの音声処理タスクにおいて依存関係をモデル化するための並列ブランチを持っています。

Latent Diffusion

Diffusion Modelsは、多くの画像処理タスクで最先端のパフォーマンスを達成するものの、計算が非常に負荷がかかります。Latent Diffusion Modelsは、Diffusion Modelsのバリエーションであり、より少ないリソースを必要としながら、さまざまな画像ベースのタスクで高いパフォーマンスを実現することができます。

CLIP-Guidance

CLIP-Guidanceは、大規模なラベル付きデータセットを必要としないテキストから3D生成の新しい方法です。CLIPなどの事前学習されたビジョン言語モデルを活用し、テキストの説明と画像を関連付けることを学ぶことができるため、研究者はそれを使用して3Dオブジェクトのテキストの説明から画像を生成します。

GPT-NeoX

GPT-NeoXは、200億のパラメータで構成される自己回帰言語モデルです。様々な知識ベースや数学タスクで合理的なパフォーマンスを発揮します。モデルの重みは一般に公開されており、さまざまな分野での研究を促進するために利用できます。

QLoRA

QLoRAはメモリ使用量を効率的に減らす細調整手法であり、48GBの単一のGPU上で65兆のパラメータモデルを最適なタスクパフォーマンスを維持しながら完全な16ビット精度で細調整することができます。QLoRAの細調整を通じて、モデルは状態-of-the-artの結果を達成し、以前のSoTAモデルを上回ることができます。

RMKV

Receptance Weighted Key Value(RMKV)モデルは、Transformerと再帰ニューラルネットワーク(RNN)の強みを活用しながら、同時にそれらの主な欠点を回避する新しいアーキテクチャです。RMKVは、同様のサイズのTransformerと比較可能なパフォーマンスを提供し、将来的により効率的なモデルの開発の道を開いています。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「脳のように機能するコンピュータビジョンは、人々が見るように見ることができます」

マサチューセッツ工科大学の研究者は、コンピュータビジョンを向上させるために、人工ニューラルネットワークを脳の下位側頭...

機械学習

スケッチベースの画像対画像変換:GANを使用して抽象的なスケッチを写実的な画像に変換する

スケッチに長けた人もいれば、他の仕事に才能を持つ人もいます。靴の画像が提示された場合、個人は写真を示す簡単な線を引く...

機械学習

「総合的な指標を通じて深層生成モデルのエンジニアリング設計評価を向上させる」

エンジニアリングデザインにおいて、深層生成モデル(DGMs)への依存度が近年急速に上昇しています。しかし、これらのモデル...

AI研究

Covid-19の多様な変異株に対応する多目的ワクチンの作成

機械学習の助けを得て、科学者たちは、すべてのSARS-CoV-2株に対して有効なワクチンを開発するために取り組んでいます

機械学習

このAI論文では、マルチビューの冗長性を超えるための新しいマルチモーダル表現学習手法であるFACTORCLを提案しています

機械学習における主要なパラダイムの一つは、複数のモダリティからの表現学習です。未ラベル付けされたマルチモーダルデータ...

データサイエンス

超幾何分布の理解

二項分布は、データサイエンスの内外でよく知られた分布ですしかし、あなたはその人気のないいところのいとこである超幾何分...