Learn more about Search Results EU - Page 8
- You may be interested
- カールスルーエ工科大学(KIT)の研究者た...
- 「静止画や無音ビデオからオーディオを取...
- 2023年の銀行システムにおける対話型AI開...
- 「カスタムレンズを使用して、優れたアー...
- 「フューショットラーニングの力を解き放つ」
- Fast.AIディープラーニングコースからの7...
- 効率的にPythonコードを書く方法:初心者...
- 大規模言語モデル(LLM)の微調整
- 「AIが空中戦にロボットの相棒をもたらす」
- 「手作業での一元配置分散分析の方法」
- 「Amazon SageMakerトレーニングワークロ...
- 「LangchainとOllamaを使用したPDFチャッ...
- タルモ・ペレイラによる生物学と神経学の...
- ジェミニに会いましょう:Googleの最大か...
- Pythonを使用してDLISファイルの内容を探...
ChatGPTが知能的ですか? 科学的なレビュー
約1年前、OpenAIはChatGPTをリリースし、世界中を席巻しましたChatGPTは、コンピュータとの対話を、従来のより制約の少ない、より自然な言語で行うという完全に新しいアプローチを取り入れました
「デジタル時代のユーザーセントリックデザイン:ウェブデザインとUI/UX体験に影響を与えるトレンド」
ユーザー体験に重点を置くウェブデザインの最新トレンドを紹介しましょうダークモードの普及から3D要素の統合まで、魅力的な要素を解説します
「ニュースレコメンデーションのための大規模な言語モデルとベクトルデータベース」
大規模言語モデル(LLM)は、Chat-GPTやBardなどの生成型AIツールの最新リリースにより、機械学習コミュニティ全体で大きな話題となりましたその中核となるアイデアの1つは...
一緒にAIを学びましょう−Towards AIコミュニティニュースレター#5
おはようございます、AI愛好家の皆さん!今週のポッドキャストのエピソードは必聴で、これまでの24エピソードの中でも一番優れていますグレッグは驚くべき洞察を共有し、起業家だけでなく関係者にも関連する情報です...
新たな研究が、AIの隠れた脆弱性を明らかにする
人工知能(AI)の急速に進化する風景では、変革的な変化の約束は、革新的な自動車が交通を再構築するという前途洋々の可能性から、複雑な医療画像の解釈でAIを洗練された利用にまで及ぶ様々な分野に広がります AI技術の進歩は、デジタルルネサンスに匹敵するものであり、溢れる未来を予感させています...
このAI論文は、高度な時空間予測のためのニューラルオペレータの自己回帰エラーに対するディープラーニングソリューションを探求しています
この研究は、自己回帰ニューラルオペレーターのドメイン内の重要な課題である予測の範囲拡張の能力の制約について探求しています。自己回帰モデルは有望であるものの、空間時間予測における安定性の問題に直面し、その効果を著しく妨げています。この包括的な問題は、比較的滑らかなフィールドからERA5のようなデータセットに特徴付けられる複雑で大規模なシステムまで、さまざまなシナリオにわたって普遍的です。 自己回帰ニューラルオペレーターの予測範囲を拡張しようとすると、現在の方法は非常に困難な障壁に直面します。この制約を認識して、研究チームは予測性を向上させる画期的な解決策を提案しています。提案された方法は、スペクトルニューラルオペレーターの基本的なアーキテクチャのシフトを引き起こし、不安定性の問題を軽減する戦略的な手法です。既存の手法とは対照的に、この革新的なアプローチはこれらのオペレーターに無限の予測範囲を与え、大きな進歩を示します。 現在のところ、自己回帰ニューラルオペレーターは予測範囲を限定して予測する能力において重要な障壁を示します。従来の手法の不安定性の課題は、特に複雑な空間時間予測シナリオにおいてその効果を制約しています。この問題に対処するため、研究チームはスペクトルニューラルオペレーターのアーキテクチャを根本的に再構築し、予測範囲の拡張の可能性を開放する新しい解決策を提案しています。 提案された方法の核心には、ニューラルオペレーターブロックの再構築があります。エイリアシングや不連続性などの課題に対処するために、研究者は非線形性の後に学習可能なフィルターを連続的に適用し、新たに生成された高周波を効果的に処理する能力を持ちます。革新的な要素は、静的畳み込みフィルターを動的フィルターに置き換え、特定のデータに適応することです。この適応性は、周波数ドメインで操作されるモードごとのマルチレイヤーパーセプトロン(MLP)によって実現されます。 提案された方法の本質は、ニューラルオペレーターブロックを再想像することにあります。エイリアシングや不連続性などの課題に対処するため、研究者は非線形性の後に学習可能なフィルターを一貫して適用し、新たに生成された高周波を処理する能力を持つ革新的なフレームワークを導入します。画期的な要素は、固定された静的畳み込みフィルターを動的フィルターに置き換え、特定のデータセットの複雑さに適応することです。この適応性は、周波数ドメインで動作するモードごとのマルチレイヤーパーセプトロン(MLP)によって実現されます。 https://openreview.net/forum?id=RFfUUtKYOG 実験の結果は、この方法の有効性を裏付けており、安定性の大幅な改善が明らかになっています。これは、回転浅水方程式やERA5データセットなどのシナリオにこの手法を適用した場合に特に明らかです。周波数適応型MLPによって生成される動的フィルターは、さまざまなデータセットに対してモデルの適応性を確保することが重要です。静的フィルターを動的なフィルターに置き換えることにより、この方法はデータに依存するエイリアシングパターンの複雑さを巧みに処理します。これは固定されたストラテジーでは達成できない成果です。 https://openreview.net/forum?id=RFfUUtKYOG まとめると、この研究は自己回帰ニューラルオペレーターにおける予測の範囲拡張の持続的な課題を克服する画期的な進歩を表しています。周波数適応型MLPによって生成される動的フィルターを取り入れたニューラルオペレーターブロックの再構築は、不安定性の問題を軽減し、無限の予測の範囲を実現するための非常に効果的な戦略です。予測の複雑さに直面する研究コミュニティにとって、この研究はより堅牢で信頼性の高い空間時間予測モデルに向けた将来の取り組みを指し示すビーコンとしての役割を果たします。
「AIアクトの解読」
AI法 [1]は、長く苦痛な過程を経て形成されましたこれは、ヨーロッパの立法プロセスにおける政治の影響と重要性を完璧に示すものですしかし、同時に欠陥があることも問題として浮かび上がります...
「2023年のAI タイムライン」
はじめに 人工知能(AI)は、技術的な進歩が人間のつながりの本質と共鳴する形で私たちの日常生活と交差する魅力的な領域です。今年は、単なるアルゴリズムを超えてAIを身近に感じる革新の物語が展開されました。2023年のAIの素晴らしいハイライトを探索しながら、この旅に参加しましょう。 AI 2023年のハイライト 2023年のAIの世界で行われた最大の発見、進歩、および世界的な変革の一部を紹介します。これらの進歩がどのように、技術が私たちの人間の体験にシームレスに統合される未来を形作っているのか、探求してみましょう。 2023年1月のAIハイライト この年は、AIが医療と健康の分野で重要な進展を示しました。MITの研究者はマサチューセッツ総合病院と連携し、CTスキャンに基づいて患者の肺がんのリスクを評価できるディープラーニングモデルを開発しました。また、革命的な進歩として、研究者たちはAIを使ってゼロから人工的な酵素やタンパク質を作り出すことが可能なAIを開発しました。 他にも多くのイノベーションの中で、人工知能は視覚障害のある人々が食料品を見つけるのを手助けするために手杖に統合されました。一方、ビジネスのフロントでは、OpenAIがMicrosoftとの数年間にわたる数十億ドルの取引を通じてAIの開発に大きく投資しました。 2023年2月のAIハイライト 2023年2月には、OpenAIのChatGPTに関する話題が最も盛り上がりました。このAI搭載のチャットボットは、アメリカ合衆国医師資格試験(USMLE)に合格し、その人気は1億人以上のユーザーにまで急上昇しました。 ChatGPTの現象に応えて、GoogleはAI会話の領域に新しい要素となるBard A.I.を導入しました。また、MicrosoftもChatGPTと統合された新しいBing検索エンジンの導入に重要な一歩を踏み出しました。 Metaは、Metaエコシステム内でAIの能力を向上させるというLLaMAを発表しました。一方、Amazon Web Services(AWS)は、一流のAIプラットフォームであるHugging Faceと提携し、AI開発者を支援しました。 画期的な成果として、オックスフォードの研究者たちはRealFusionを示し、単一の画像から完全な360°写真モデルを再構築することができる最新のモデルを実証しました。 2023年2月には、AIの世界は音楽生成の領域にも足を踏み入れました。Google ResearchはMusicLMを紹介し、さまざまなジャンル、楽器、概念で曲を作成できるトランスフォーマーベースのテキストからオーディオへのモデルを提供しました。一方、Baiduの研究者はERNIE-Musicを発表し、拡散モデルを使用して、波形領域での最初のテキストから音楽を生成するモデルを開発しました。これらのモデルは、AIと創造的表現の融合における重要な進歩を示しています。 2023年3月のAIハイライト 2023年3月には、創造的なAIはいくつかの興味深い進展を見せました。AdobeはFireflyというAIをバックアップする画像生成および編集ツールの範囲でGenAIの領域に参入しました。一方、Canvaはユーザー向けにAIパワードの仮想デザインアシスタントとブランドマネージャーを導入しました。 テックジャイアンツのAIプロジェクトは、第1四半期終盤に向けて全力で進展していました。OpenAIはChatGPTとWhisperというテキストから音声へのモデルのためのAPIを発売しました。OpenAIはまた、ChatGPTのためのいくつかのプラグインをリリースし、最も高度なAIモデルであるGPT-4を正式に発表しました。 HubSpotはユーザー向けにChatSpot.aiとContent Assistantという2つの新しいAIパワードツールを導入しました。ZoomはスマートコンパニオンのZoom…
このAI論文は、「Vary」という新しいアプローチを明らかにしています:高度な多言語認識タスクのための大規模なビジョン言語モデルの視覚語彙を拡張するためのアプローチ
大視覚言語モデル(LVLM)は、コンピュータビジョンと自然言語処理を組み合わせて、視覚的なコンテンツのテキストの説明を生成することができます。これらのモデルは、画像のキャプション付け、可視化された質問応答、および画像の検索など、さまざまなアプリケーションで驚異的な進展を遂げています。しかし、その優れたパフォーマンスにもかかわらず、LVLMはまだいくつかの課題に直面しています。特に、密で詳細な知覚を必要とする特殊なタスクにおいて、ビジョンの語彙が制約されているという問題です。 中国科学技術大学、MEGVIIテクノロジー、および中国科学院の研究者たちは、固有の認識力を必要とする特殊なタスクのためにLVLMを強化するVaryという方法を導入しました。Varyは、効率的に新しい特徴を獲得し、詳細な知覚を改善するためのLVLMを活性化します。実験結果は、Varyの効果を示しています。研究者たちは、さらなる探求のためのプラットフォームとしてVaryを提案しています。研究では、GPT-4をトレーニングデータ生成に使用し、Varyの応用範囲をさまざまな視覚タスクに適用することを強調しています。これにより、LVLMの能力が拡張される一方で、元の能力も維持されます。 この研究は、CLIP-VITなどの一般的なビジョン語彙の制約に取り組んでおり、LVLMにおいてビジョン語彙をスケールアップする必要性を提起しています。これにより、外国語のLVLMのテキスト語彙を拡張することに着想を得たVaryという方法を導入しました。Varyは、語彙ネットワークを使用して新しいビジョン語彙を生成し、元の語彙と統合します。これにより、非英語のOCRやチャート理解などの様々なタスクにおけるエンコーディング効率とモデルパフォーマンスが向上します。この研究は、Varyの設計が今後の研究を刺激すると予想しています。 この研究では、Varyの2つの構成「Vary-tiny」と「Vary-base」を紹介しています。細かい知覚に焦点を当てたVary-tinyは、テキスト入力ブランチを持たず、小さなOPT-125Mモデルを使用します。ドキュメントとチャートのデータを正例、自然画像を負例としてトレーニングされます。Vary-tinyの語彙ネットワークは新しいビジョン語彙を生成し、Vary-baseでは元の語彙と統合されます。Vary-baseのトレーニングでは、両方の語彙ネットワークが使用され、重みが固定されますが、LVLMのパラメータと入力埋め込み層が最適化されます。具体的な実装の詳細には、AdamW最適化、余弦退火スケジューラ、特定の学習率が含まれます。ドキュメントとチャートの理解のための合成データが作成されます。 Varyは、複数のタスクで有望なパフォーマンスを発揮し、ドキュメントレベルのOCR、チャート理解、およびMMVetタスクで優れた結果を達成しています。具体的には、DocVQAでは78.2%、MMVetでは36.2%のANLSを達成し、新しいドキュメントの解析機能における能力を示しています。また、Vary-tinyとVary-baseは、ドキュメントOCRタスクで強力な結果を示しており、Vary-baseは他のLVLMを凌駕しています。この研究はVaryの成功を認めつつ、視覚語彙をスケールアップする効果的な改善の必要性を強調しています。 まとめると、この研究の主なポイントは次のように要約されます: 提案: LVLMにおける視覚語彙のスケールアップのための効率的な方法。 手法: 提案された方法は、オリジナルの言語と統合されたネットワークを介して生成された新しいビジョン語彙を導入します。 能力: この方法は、特にドキュメントレベルのOCRやチャート理解のタスクにおいて、詳細な知覚を向上させます。LVLMの元々の機能は維持しながら、素早く新しい特徴を獲得します。 パフォーマンス: さまざまなタスクで有望なスコアが示されており、この方法はドキュメント解析機能で他のLVLMを凌駕しています。
『LLM360をご紹介します:最初の完全オープンソースで透明な大規模言語モデル(LLM)』
“`html オープンソースの大規模言語モデル(LLM)であるLLaMA、Falcon、Mistralなどは、AIのプロフェッショナルや学者向けにさまざまな選択肢を提供しています。しかし、これらのLLMの大部分は、エンドモデルの重みや推論スクリプトなどの一部のコンポーネントだけが利用可能であり、技術的なドキュメントでは、一般的な設計の側面や基本的なメトリックに焦点を絞った内容が多いです。このアプローチでは、LLMのトレーニング手法の明確性が低下し、チームがトレーニング手順のさまざまな側面を継続的に解明するための努力が重複してしまいます。 Petuum、MBZUAI、USC、CMU、UIUC、UCSDの研究者チームが、LLM360を導入しました。これは、エンドツーエンドのLLMトレーニングプロセスを透明で再現可能にすることにより、オープンかつ協力的なAIの研究をサポートするイニシアチブです。LLM360は、トレーニングコードとデータ、モデルのチェックポイント、中間結果などのすべてをコミュニティに提供することを主張する、完全なオープンソースのLLMです。 LLM360に最も近いプロジェクトはPythiaであり、LLMの完全な再現性を目指しています。GPT-JやGPT-NeoXなどのEleutherAIモデルは、トレーニングコード、データセット、中間モデルのチェックポイントと共にリリースされており、オープンソースのトレーニングコードの価値を示しています。INCITE、MPT、OpenLLaMAは、トレーニングコードとトレーニングデータセットがリリースされ、RedPajamaも中間モデルのチェックポイントを公開しています。 LLM360は、AMBERとCRYSTALCODERの2つの7BパラメータLLMをリリースし、そのトレーニングコード、データ、中間チェックポイント、分析も提供します。事前トレーニングデータセットの詳細、データの前処理、フォーマット、データミキシングの比率、LLMモデルのアーキテクチャの詳細については、研究で詳しく説明されています。 この研究では、以前の研究で導入された記憶スコアの使用と、メトリック、データチャンク、チェックポイントの公開により、研究者が対応関係を容易に見つけることができるようになることを示しています。研究ではまた、LLMが事前にトレーニングされたデータを削除することの重要性や、データのフィルタリング、処理、トレーニング順序の詳細についても強調しています。 研究では、ARC、HellaSwag、MMLU、TruthfulQAの4つのデータセットについてのベンチマーク結果が示され、モデルの事前トレーニング中のパフォーマンスが示されています。HellaSwagとARCの評価スコアはトレーニング中に単調に増加し、TruthfulQAのスコアは減少します。MMLUのスコアは最初に減少し、その後成長します。AMBERのパフォーマンスはMMLUなどのスコアで競争力があるものの、ARCでは遅れています。ファインチューニングされたAMBERモデルは、他の類似モデルと比較して強力なパフォーマンスを示します。 LLM360は、オープンソースLLMの完全かつ包括的なイニシアチブであり、オープンソースのLLM事前トレーニングコミュニティ内での透明性を推進するものです。この研究では、AMBERとCRYSTALCODERの2つの7B LLMをトレーニングコード、データ、中間モデルのチェックポイント、分析と共にリリースしています。研究では、チェックポイント、データチャンク、評価結果を公開することにより、包括的な分析と再現性を可能にするため、すべての角度からLLMをオープンソース化することの重要性を強調しています。 “`
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.