Learn more about Search Results A - Page 129

「非営利研究者による人工知能(AI)の進展リスト」

去年遅くから今年にかけて、2023年はAIの人々がAIアプリケーションを作成するのに最適な時期であり、これは非営利の研究者によるAIの進歩リストのおかげです。以下にそのリストを示します。 ALiBi ALiBiはTransformersにおけるテキストの推測問題に効率的に取り組む方法であり、学習に使用されたものよりも長いテキストシーケンスを推測する際に適用されます。ALiBiは実行時間に影響を与えず、追加のパラメータも必要とせず、既存のTransformerコードの数行を変更するだけで推測を行うことができる実装が容易なメソッドです。 Scaling Laws of RoPE-based Extrapolation この方法は、Transformerの推測能力を向上させるためのフレームワークです。研究者は、Rotary Position Embedding(RoPe)ベースのLLMを事前学習の文脈長でより小さなまたは大きなベースで微調整すると、より良いパフォーマンスが得られることを発見しました。 FlashAttention Transformersは、テキスト情報を処理できる強力なモデルですが、大規模なテキストシーケンスで作業する場合には大量のメモリが必要とされます。FlashAttentionは、既存の基準よりも高速でTransformerをトレーニングする、入出力(IO)を考慮したアルゴリズムです。 Branchformer Conformers(Transformerの一種)は音声処理に非常に効果的です。それらは畳み込み層とセルフアテンション層を順次使用するため、そのアーキテクチャは解釈しづらいものとなっています。Branchformerは、エンコーダの代替手法であり、柔軟で解釈可能であり、エンドツーエンドの音声処理タスクにおいて依存関係をモデル化するための並列ブランチを持っています。 Latent Diffusion Diffusion Modelsは、多くの画像処理タスクで最先端のパフォーマンスを達成するものの、計算が非常に負荷がかかります。Latent Diffusion Modelsは、Diffusion Modelsのバリエーションであり、より少ないリソースを必要としながら、さまざまな画像ベースのタスクで高いパフォーマンスを実現することができます。 CLIP-Guidance CLIP-Guidanceは、大規模なラベル付きデータセットを必要としないテキストから3D生成の新しい方法です。CLIPなどの事前学習されたビジョン言語モデルを活用し、テキストの説明と画像を関連付けることを学ぶことができるため、研究者はそれを使用して3Dオブジェクトのテキストの説明から画像を生成します。…

「FourCastNet(フォーキャストネット)との出会い:高速かつ正確なディープラーニング手法によって天気予報を革新するグローバルなデータ駆動型天気予測モデル」

1920年代に数値予報(NWP)が登場しました。これらは、輸送、物流、農業、エネルギー生産などの重要な産業で経済計画に役立ちます。正確な天気予報によって、重大な災害を事前に警告することで数多くの命が救われています。過去数十年間、天気予報は品質が向上しています。Lewis Fry Richardsonは、1922年に単一の場所の6時間の大気予報を計算するためにスライドルールと対数表を使用して最初の動的モデル化された数値予報を計算しました。彼は大気の予報を作るのに6週間かかりました。1950年代までに、初期の電子計算機は予測速度を大幅に向上させ、未来の予測に役立つように迅速に計算できるようにしました。 気象予報の改善は、高速計算能力の向上に加えて、物理学のより深い知識とより良い大気観測により、小規模現象のパラメータ化の改善によって可能になりました。後者はデータの同化によって、より良いモデルの初期化につながりました。最先端のNWPモデルよりも桁違いに安価な処理コストを持つデータ駆動型のDeep Learning(DL)モデルは、天気予報においてますます人気が高まっています。大気の大規模循環を予測するためのデータ駆動型モデルの構築は、いくつかの研究の対象となっています。これらのモデルは、気候モデルの出力、一般循環モデル(GCM)、再解析データ、または気候モデルの出力と再解析データの組み合わせを使用してトレーニングされています。 データ駆動型モデルは、NWPモデルに存在するモデルバイアスを取り除き、予測の確率的予報とデータ同化を低い計算コストで可能にすることで、天気予報の向上に大きな可能性を提供します。データ駆動型モデルは、データや観測の再解析をトレーニングすることで、降水予測に大きな影響を与える対流パラメータ化スキームのバイアスなどのNWPモデルの制約を回避することができます。一度トレーニングされると、データ駆動型モデルは通常のNWPモデルよりも桁違いに早く予測を生成し、非常に大規模なアンサンブルの作成が可能となります。このような文脈では、研究者たちは大規模なデータ駆動型のアンサンブルが、季節間(S2S)予測で限られた数のアンサンブルメンバーしか含むことができない運用NWPモデルよりも優れていることを示しています。 さらに、大規模なアンサンブルは、データ駆動型予測による極端な気象現象の予測をサポートします。しかし、ほとんどのデータ駆動型の気象モデルは、トレーニングに低解像度のデータを使用しており、通常は5.625または2の解像度です。広範な低解像度の大気変数の予測は過去に成功しています。ただし、粗視化プロセスにより、重要な細かいスケールの物理的情報が失われます。データ駆動型モデルは、最新の最先端の数値予報モデルと同じまたはより高い解像度で予測を提供する必要があります。たとえば、5.625の空間解像度では、世界を表す32×64ピクセルのグリッドしか提供できません。 このような予測では、500km未満の特徴を区別することはできません。小規模なダイナミクスの大規模なスケールへの重要な影響や、山脈や湖などの地形的要因の小規模なダイナミクスへの影響は、そのような不正確な予測では考慮されません。低解像度の予測は特定の状況でのみ使用される場合があります。高解像度のデータ(たとえば、0.25の解像度)は、複雑な細かいスケール構造を持つ低層の風(U10およびV10)などの変数のデータ駆動型モデルの予測を大幅に改善することができます。一方、大気のジオポテンシャル高度(Z500)などの変数では、低解像度の予報が正当化されるかもしれませんが、多くの小規模構造は存在しません。 さらに、粗いグリッドでは、熱帯低気圧などの高影響の強い事象の発生と振る舞いを正確に描写することはできません。高解像度のモデルはこれらの側面に対処できます。その戦略:NVIDIA Corporation、Lawrence Berkeley、Rice University、University of Michigan、California Institute of Technology、Purdue Universityからの研究者が、FourCastNetというフーリエベースのニューラルネットワーク予測モデルを作成し、赤道付近で30km、または0.25の解像度で重要な大気変数のグローバルなデータ駆動型予測を行うことができるようにしました。これにより、初めてECMWFの高解像度統合予報システム(IFS)モデルによって得られた結果と直接比較することができます。 図1は、96時間先のリードタイムでの世界的な地上近辺風速予測を示しています。彼らの予測では、Super Typhoon MangkhutやFlorence、Issac、Heleneといった3つの名前が付けられたサイクロンがアメリカ東海岸に向かって移動するなど、高解像度で解決し確実に追跡される重要な特徴が強調されています。 まとめると、FourCastNetはデータ駆動型の天気予測に以下の4つの新しい改善点を提供しています: 1. FourCastNetは、1週間までの予測リード期間で表面風や降水などの難しい変数を正確に予測します。グローバルスケールでの表面風予測は、まだどの深層学習(DL)モデルを使用しても試されていません。さらに、小スケールの特徴を解決できるグローバルDLモデルはまだありません。風力エネルギー資源の計画や災害軽減には、これが大きな影響を与えます。…

人工知能(AI)と法的身分

この記事では、特に民法に基づいて人工知能(AI)に法的主体の地位を与える問題に焦点を当てていますここで法的身分は、法的能力の概念と密接に結び付いた概念として定義されていますが、これは道徳的主体性が道徳的人格と同じであるということを受け入れることを意味するものではありません法的身分[...]

「MFAを超えて:オクタがエンタープライズアイデンティティを再定義する方法」

新しい解決策は、AIと自動化を活用して企業のセキュリティ姿勢を強化し、従業員の生産性を高めます

VoAGIニュース、10月27日:データサイエンスをマスターするための5冊の無料の本 • LLMをマスターするための7つのステップ

今週のVoAGIで、大規模言語モデルの学習からLLMアプリの構築と展開までを7つのステップで行いますPython、統計学、線形代数、機械学習、ディープラーニングの学習に役立つ無料の書籍リストもチェックしてくださいさらに、他にもたくさんの情報があります!

AIを通じて、AskEllyn Bridgesは乳がん患者のサポートギャップを埋める

テクノロジーにますます依存する世界において、医療の領域は革新と思いやりの前例のない融合を目の当たりにしていますAskEllynという画期的な対話型AIツールが登場しましたAskEllynは、乳がんに影響を受ける人々の多面的なニーズに特化して設計されたものです数多くのテクノロジーソリューションが存在していますが、AskEllynは情報提供にとどまらず、独自の特徴を持っています

倉庫業務の変革:AIと自動化の力を活用する

グローバルな供給チェーンの進化に伴い、顧客の要求に応える倉庫の役割がますます重要になってきています

生成AI 最初のドラフト、最終的なものではない

この記事は、LLLの仕組みとそれに伴う制約を、分かりやすい説明や逸話を交えながら概説していますまた、人々がLLLを自分のワークフローに導入する方法についてもアドバイスを提案しています

決定科学がデザインと出会う” (Kettei kagaku ga dezain to deau)

デザインプロセスは、ここ数十年で劇的に変化しましたかつては人間の直感、判断力、美的な好みによって主導されていた領域が、現在では計算方法によって補完されています...

「ウッドペッカーは、言語モデルにおけるAIの精度を革新している方法とは?」

中国の腾讯YouTu Labと中国科学技術大学(USTC)のAI研究者グループが、Multimodal Large Language Models(MLLM)の幻想問題に取り組むために開発されたAIフレームワーク「Woodpecker」を発表しました。この開発は画期的なものです。本記事では、Woodpeckerの意義、機能、およびAI産業への変革の可能性について探っていきます。 幻想の課題を理解する AIモデルは、訓練セットと何の関係もない結果を自信満々に表示するという幻想という混乱した問題に直面しています。そこで救世主として登場するのがWoodpeckerです。Woodpeckerは、特に視覚とテキストデータを統合したGPT-4VなどのMultimodal Large Language Models(MLLM)に焦点を当てています。 詳しくはこちらをご覧ください:Woodpecker:Multimodal Large Language Modelsの幻想修正 Woodpeckerのソリューション:幻覚の修正 Woodpeckerは名前だけでなく、強力なツールです。この画期的なフレームワークは、GPT-3.5 Turboを始めとする3つのAIモデルを使用して幻想を検出および修正します。重要なステップである視覚的な知識の検証やキーコンセプトの抽出など、5つのステップからなる手順を使用しています。 素晴らしい結果:精度の30.66%の向上 ここで魔法が起こります。Woodpeckerに関する研究では、基準モデルと比較して驚異的な30.66%の精度向上が示されています。この数字は、WoodpeckerがAIモデルの性能を大幅に改善することができるかを示しています。 Woodpeckerのワークフローの一部を垣間見る Woodpeckerの操作の微妙なニュアンスを見てみましょう。5つのステップはタスクシンフォニーを構成しています。まず、テキストが参照する重要なアイテムをリストアップします。次に、これらのアイテムに関するクエリを投げ、それらの数量や特性を調べます。視覚的な知識の検証というプロセスを通じて、フレームワークは専門家モデルを使用してこれらの質問に答えます。そしてここで魔法が起こります:質問-回答ペアは、画像の属性やオブジェクトレベルでの主張を含む視覚的な知識ベースに変換されます。最終的に、Woodpeckerは幻覚を取り除き、関連する証拠を追加し、視覚的な知識ベースをガイドとして使用します。 オープンソースでインタラクティブ:AIの応用を広げる Woodpeckerの開発者たちは情報の共有を目指しています。ソースコードは親切に提供されており、広いAIコミュニティはこの画期的なフレームワークを調査して活用することができます。また、インタラクティブなシステムデモも用意されており、ユーザーはWoodpeckerの能力を直に確認し、幻覚の修正能力を理解することができます。 Woodpeckerの効率を評価する…

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us