Learn more about Search Results A - Page 128

ノースウェスタン大学の研究者は、AIのエネルギー使用量を99%削減したオフグリッド医療データの分類のための画期的な機械学習フレームワークを提案しました

最近、ノースウェスタン大学の研究者たちは、特に心電図(ECG)の解釈の文脈で、オフグリッド医療データの分類と診断に画期的な機械学習フレームワークを提案しました。この論文では、低電力計算ハードウェア上でのECG分類のためのサポートベクターマシン(SVM)アルゴリズムの実装の課題について議論しています。この論文では、デュアルゲート型ヴァンダーワールス異接合を基にした混合カーネルトランジスタを使用した新しい解決策を示しています。 この論文は、オフグリッド医療データの分類と診断における現存する問題に取り組んでいます。課題は、ECG分類のためのSVMアルゴリズムの実装において、従来のCMOS回路を使用した場合の複雑さと相当な消費電力にあります。 論文では、ECGの解釈のための現在利用可能な手法とフレームワークを取り上げ、SVMが効率的でニューラルネットワークよりも計算負荷が少ないことを強調しながら、CMOS回路を使用したハードウェア実装は消費電力と複雑さの面で制約があると指摘しています。 研究者たちは、デュアルゲート型ヴァンダーワールス異接合を基にした再構成可能な混合カーネルトランジスタを提案しています。これらのトランジスタは、アナログSVMカーネルアプリケーションに対して完全に可変のガウス関数とシグモイド関数を生成することができ、ECGの解釈など、オフグリッド医療データ分類においてよりエネルギー効率の高い実用的なアプローチを提供します。 論文は、混合カーネルトランジスタの詳細について詳しく説明しています。これらのトランジスタは、単層の二硫化モリブデン(MoS2)をn型材料とし、溶液プロセスされた半導体カーボンナノチューブ(CNTs)をp型材料として使用しています。電場スクリーニングの精密な制御により、単一のデバイスを使用して細かく粒状化されたガウス、シグモイド、および混合カーネル関数の完全なセットを生成することができます。この再構成可能性により、ベイズ最適化を使用して個別の患者プロファイルに合わせたパーソナライズされた検出が可能となります。 研究者たちは、ECG信号からの不整脈検出において、混合カーネルトランジスタの効果を実証しています。彼らは従来の放射基底関数カーネルと比較し、異接合で生成されたカーネルが高い分類性能を達成していることを示しています。さらに、研究者はベイズ最適化を使用してハイパーパラメータを最適化し、分類性能を向上させ、個別の不整脈検出に適したものとしています。 総括すると、研究者たちは、従来のCMOS実装よりも混合カーネルトランジスタの利点を強調しています。彼らは、1つの混合カーネル異接合デバイスで、CMOS回路では数十のトランジスタが必要となるものを実現できることを強調しています。このアプローチは、ウェアラブルおよびエッジ環境でのSVM分類アプリケーションにおいて、低消費電力かつスケーラブルな解決策を提供します。この研究は、ECGの解釈や他のヘルスモニタリングシナリオにおけるオフグリッド医療データ分類と診断の分野において、有望な展開を示しています。混合カーネルトランジスタは、よりエネルギー効率の高い再構成可能な解決策を提供し、個別化された効率的な医療データ分析の道を開いています。

GoogleシートのAI搭載ソリューション「スマートフィル」によるデータ処理の革新

データ管理とスプレッドシートの愛好家にとって、手作業でデータ処理を行うことは常に煩雑で時間のかかる作業でした。フィードバックの分類、ニュース記事の整理、住所データの標準化、テキストフィールドから貴重な情報を抽出するなど、この反復作業の負担は多くの人々にとって共通の悩みでした。 従来、Google Sheetsなどのスプレッドシートソフトウェアのユーザーは、これらの課題に取り組むために手作業のデータ入力や複雑な数式に頼る必要がありました。しかし、希望の光が現れました。情報処理の効率的な方法を熱心に求めるデータ愛好家たちは、AIが救世主になることはあるのかという疑問を抱きました。 AIによるデータ処理の解決策は利用可能ですが、これらはしばしば煩雑なセットアップとプログラミングの専門知識を要します。しかし、Google Sheetsの「スマートフィル」はこの風景を革新すると約束しています。このエキサイティングな機能は、頼れるスプレッドシートとChatGPTのスマートな能力の結合と見なすことができます。 Google Workspaceを通じて利用可能なスマートフィルは、2つの列間の関係を自動的に検出し、入力する値を予測することで、データ操作の手間を省きます。この驚くべきAI技術はデータを理解し、全体のプロセスを効率化します。これにより、ユーザーは多くの手動作業の時間を節約する可能性があります。 このAI技術による最も魅力的な側面の1つは、さまざまなタスクにシームレスに対応できる能力です。テーマごとにフィードバックを分類し、トピックごとにニュース記事を整理し、一貫性のない住所データを統一された形式に変換し、テキストフィールドから電話番号を抽出することは、その数多くのアプリケーションの一部です。スマートフィルの使いやすさと多様性は、どんなデータ愛好家にも感銘を与えるでしょう。 いかなる技術的な進歩の正確な評価は、そのパフォーマンス指標にあり、スマートフィルも例外ではありません。早期の採用者は、データ処理タスクを最大4倍速く完了できるという大幅な時間節約を報告しています。さらに、AIモデルによって行われる予測の正確さは驚くべきものであり、手動データ入力に関連するエラーの可能性を最小限に抑えています。 結論として、「スマートフィル」をGoogle Sheetsに導入することは、データを扱うすべての人にとって画期的な進歩です。時間のかかるデータ処理の古い問題だけでなく、使いやすく非常に効果的な方法でこれを解決します。スマートフィルのデータ関係を理解し、予測する能力は、スプレッドシート技術の大きな進歩だけでなく、さまざまなユーザーにとっても重要な時間節約です。このAI技術を採用する個人や企業が増えれば、手動データ入力の苦労の日々は遠い記憶になるかもしれません。

[GPT-4V-Actと出会いましょう:GPT-4V(ision)とウェブブラウザを調和させたマルチモーダルAIアシスタント]

最新プロジェクトのGPT-4V-Actのリリースを、Machine Learningの研究者が最近Redditコミュニティと共有しました。このアイデアは、GPT-4VのSet-of-Markとして知られる視覚地上戦略の最近のディスカッションで火をつけられました。興味深いことに、テストではこの機能を備えたGPT-4Vがユーザーインターフェースのスクリーンショットを分析し、特定のタスクを完了するために必要なピクセル座標を提供できることが示されました。 これまで、このエージェントはRedditでの投稿、製品検索、そしてレジプロセスの開始などが可能であり、限られたテストにしか耐えていませんが、興味深いことに、ゲームをプレイしようとした際にオートラベラーの欠陥を認識し、そのアクティビティを修正しようとしました。 GPT-4V(ision)とウェブブラウザを完全に統合したGPT-4V-Actは、明晰なマルチモーダルAIヘルパーです。これにより、マウスとキーボードの入出力の低レベルまで人間の制御をシミュレートすることができます。この目標は、人間とコンピュータの間の作業の円滑なフローを提供し、どのUIの使いやすさを大幅に向上させ、ワークフローの自動化を容易にし、自動化されたUIテストの利用を可能にする技術の開発につなげることです。 動作原理 GPT-4V-Actは、GPT-4V(ision)とSet-of-Mark Prompting、および個別のオートラベラーを組み合わせることで実現されます。対話可能なユーザーインターフェースの要素ごとに、このオートラベラーによって数値のIDが付けられます。 GPT-4V-Actは、タスクとスクリーンショットからタスクの完了に必要な手順を推測することができます。番号のラベルは、マウスやキーボードによって入力された場合に正確なピクセル座標へのポインタとして使用できます。 重要な注意 GPT-4V(ision)は一般に公開されていないため、このプロジェクトでのマルチモーダルなプロンプティングには、現在のChatGPT Plusの購読が必要です。なお、このプロジェクトでの未承認のGPT-4V APIの使用は、対応するChatGPTの利用条件に違反する可能性があります。 関数呼び出しなどの機能を備えた言語モデル(LM)の使用は増加しています。これらは主にAPIと状態のテキスト表現上で動作します。ユーザーインターフェース(UI)を持つエージェントは、これらが不可能な一般的な状況でより有用かもしれません。エージェントのコンピュータとの相互作用が人間に類似しているため、専門的な知識を必要とせず、エキスパートのデモによるトレーニングが行われることができます。

アデプトAIはFuyu-8Bをオープンソース化しました:人工知能エージェントのためのマルチモーダルアーキテクチャ

人工知能において、テキストと視覚データのシームレスな融合は長い間複雑な課題でした。特に高効率なデジタルエージェントの開発においてはそうです。Adept AIの最新製品であるFuyu-8Bの発売は、多モーダル画像の理解を簡素化する革新的な進歩を示しています。 デジタルエージェントの要求と非構造化の知識労働者データの複雑な要件に対応するためにカスタマイズされたFuyu-8Bは、統一的なテキスト-イメージ処理の領域で重要な進歩を成し遂げています。この進歩により、複雑なデータ統合タスクの管理におけるより合理化された直感的なアプローチが約束され、様々な領域における効率的なAI駆動型ソリューションの可能性が広がると期待されています。 既存の多くのモデルが複雑なアーキテクチャに取り組んでいる中、Fuyu-8Bはシンプルさと効率性を追求することで差をつけています。 Adept AIによって開発されたこのモデルは、専用の画像エンコーダが不要な基本のデコーダ-トランスフォーマーを採用しています。Fuyu-8Bの柔軟なフレームワークは、テキストと画像をシームレスに処理し、さまざまな画像解像度に対応しています。その革新的な設計により、Fuyu-8Bは複雑な図表やグラフを理解するだけでなく、画面上の光学文字認識(OCR)タスクを実行し、ユーザーインターフェース(UI)ベースのクエリに応答する能力を備えており、これによりさまざまなAIアプリケーションにおいて汎用性と不可欠なツールとなっています。 Fuyu-8Bの堅牢な性能は、テキストと画像データの統合を簡素化するように設計されたアーキテクチャが主たる要因です。専用の画像エンコーダに関連する複雑さを回避することで、モデルはユーザーに直感的かつ効率的なワークフローを提供し、多モーダルデータの繊細な部分をスムーズに操作できます。複雑な図表やグラフの処理とOCRタスクの高い能力は、画像ベースのクエリの処理におけるその適応性と柔軟性を示しています。Fuyu-8Bはシンプルな設計でありながら、標準的な画像理解ベンチマークで優れた性能を発揮し、多モーダルAIモデルの中でもトップランナーとしての評価を確立しています。 Fuyu-8Bの導入は、効率的な画像理解のための多モーダルモデルを簡素化し、強化する取り組みにおいて重要な進展を示すものです。 Adept AIがシンプルさと機能性に重点を置いていることは、画像の処理と理解に関連する複雑さに効果的に対処していることを示しています。Fuyu-8Bの印象的なパフォーマンスと使いやすいアーキテクチャは、AIツールの将来の開発の基盤を築き、デジタルエージェントと知識労働者の変化するニーズに対応する直感的かつ適応可能なモデルの重要性を強調しています。実用性とシームレスな統合能力により、Fuyu-8BはAIと機械学習の中で多モーダルモデルの持続的な進化の予兆となり、将来におけるさまざまな革新的な可能性を約束しています。

「人工知能生成コンテンツ(AIGC)におけるビデオ拡散モデルの包括的なレビュー」

人工知能は急速に発展しており、そのサブフィールドであるコンピュータビジョンの分野も同様です。研究者、学術界、学者など、さまざまな業界やアプリケーション(コンピュータグラフィックス、美術・デザイン、医療画像など)に大きな影響を与えており、注目を浴びています。さまざまなアプローチの中で、イメージ生成のための主な技術は拡散モデルです。これらのモデルは、敵対的生成ネットワーク(GAN)および自己回帰変換器に基づく戦略を上回り、制御可能で幅広い出力を作成し、非常にリアルな画像を生成できるため、好まれています。3D生成、ビデオ合成、密な予測、画像編集など、さまざまなコンピュータビジョンのタスクで使用されています。 拡散モデルは、AI生成コンテンツ(AIGC)の最近のブームによって、コンピュータビジョンの著しい進歩に重要な役割を果たしてきました。これらのモデルは、画像の生成と編集において優れた結果をだけでなく、ビデオに関連する研究でも先導的な役割を果たしています。画像生成の文脈で拡散モデルについての調査を行った調査論文は発表されていますが、ビデオの分野での使用についての最近のレビューは限られています。最近の研究では、AIGC時代のビデオ拡散モデルの包括的な評価を行い、このギャップを埋めることを目的としています。 最近の研究論文では、研究者チームが拡散モデルがいかに重要であるかを強調し、代替技術を上回り、画像の生成と編集、およびビデオ関連の研究分野で優れたパフォーマンスを示すかを示しています。この論文の主な焦点は、AIGCの文脈でのビデオ拡散モデルの徹底的な調査です。これは、ビデオの作成、編集、理解に関連するタスクについて詳細に説明しています。報告書は、研究者が行った実用的な貢献をまとめ、これらの分野で既に書かれた文献をレビューし、その内容を整理しています。 この論文では、この分野の研究者が直面する困難も共有されています。また、ビデオ拡散モデルの将来の研究開発に向けた展望を示し、課題も述べています。 この研究論文の主な貢献は以下の通りです。 ビデオ拡散モデルに関連する現在の研究の分類と統合が含まれており、ビデオの作成、編集、理解など、さまざまなトピックを扱っています。 ビデオ拡散モデルに関する背景情報と関連データが提供されており、データセット、評価指標、および問題の定義も含まれています。 共通の技術情報に焦点を当てた、このトピックにおける最も影響力のある研究をまとめた要約が共有されています。 ビデオ生成のベンチマークや設定についての詳細な調査と比較が行われており、文献における重要なニーズに対応しています。 まとめると、AIGCの文脈でのビデオ拡散モデルの最新の展開に興味を持つ方にとって、この研究は貴重なツールです。また、コンピュータビジョンの文脈での拡散モデルの重要性を強調し、ビデオの分野でのさらなる研究とレビューの必要性を認識しています。この研究は、過去の研究を分類し評価することによって、トピックについて徹底的な概要を提供し、将来の動向や課題についての洞察を示しています。

「Amazon Personalizeと生成AIでマーケティングソリューションを向上させましょう」

生成的な人工知能は、企業のビジネスの進化をもたらしています組織はAIを活用してデータに基づく意思決定を改善し、オムニチャネルの体験を向上させ、次世代の製品開発を推進しています企業は具体的には、電子メール、プッシュ通知、その他のアウトバウンドコミュニケーションチャネルを通じてマーケティングの取り組みを強化するために生成的なAIを活用していますガートナーは「2025年までに、アウトバウンドマーケティングメッセージの30%がAIによって生成される」と予測しています

Llemmaに会ってください:現行基準を超える次世代数学オープン言語モデル

様々なテキストの混合物を学習した言語モデルは、非常に汎用的な言語理解と生成能力を持ち、幅広い応用に適応可能なベースモデルとして機能します。 この研究では、プリンストン大学、EleutherAI、トロント大学、ベクター研究所、ケンブリッジ大学、カーネギーメロン大学、ワシントン大学の研究者チームが、数学に特化したドメイン固有の言語モデルを開発しました。彼らはこの試みに取り組む動機を複数提示しています。まず、数学の問題を解くためには、特殊な事前知識の大量のコーパス内のパターンを識別する能力が必要であり、これはドメイン適応の理想的な文脈となります。次に、数学的な推論自体が人工知能の分野での中心的な課題であり、現代の研究の対象であるという点です。さらに、堅固な数学的推論が可能な言語モデルの開発は、報酬モデリング、推論における強化学習、アルゴリズミックな推論といった様々な研究領域に広範な影響を与えます。 上記の画像は、ProofPile-2での継続的な事前学習が改善された数学的能力を持つLLEMMAというベースモデルを示しています。著者たちによる貢献は以下の通りです。 彼らはLLEMMAモデルを訓練し、公開しました。これは数学のタスクに特化した7Bおよび34Bのパラメータ言語モデルであり、数学の公開ベースモデルの新たな最先端を示しています。 彼らは数学の文脈と密接に関連している11BトークンのコードからなるデータセットであるAlgebraicStackを紹介しました。 彼らの研究は、Pythonインタプリタや形式的な定理証明器を含む計算ツールを使用して数学の問題を解決する際のLLEMMAモデルの能力を示しています。 これに対して、Lewkowyczら(2022)によるMinervaなどの既存の数学の言語モデルとは異なり、LLEMMAモデルは公にアクセス可能であり、著者は訓練データとコードをオープンソースにしています。この決定は、LLEMMAが数理推論の分野における将来の研究の基盤としての役割を促進しています。 彼らの研究は、LewkowyczらによるMinervaで行われた研究を拡張し、以下のようないくつかの注目すべき違いがあります。 (1)彼らのモデルであるLLEMMAは、訓練および評価の両方でより幅広いデータとタスクを含んでいます。これにはAlgebraicStackなどのコードデータの組み込み、様々なツールの利用、形式的な数学のタスクへの取り組みが含まれます。 (2)著者たちのアプローチは、公に利用可能なツールやデータソースに完全に依存しています。 (3)彼らは訓練データの組成、記憶パターン、および追加の教師あり微調整など、新しい分析を紹介しています。 (4)重要なことに、彼らの研究に関連するすべての成果物は一般に公開されています。 研究者たちは、LLEMMAとProof-Pile-2が将来の調査の堅固な基礎となり、言語モデルの一般化、データセットの組成分析、特定のドメインに特化した言語モデルの拡張、数学者のツールとしての言語モデルの利用、および言語モデルの数学的能力の向上などの研究活動を支援するリソースとなることを期待しています。

リシ・スナック、新しいグローバルAI安全機関のビジョンを明確化

に英国の首相は、彼が来週発表する予定のさまざまな新しいAIガバナンスイニシアチブについての中国からの支援を求めることを擁護しました

「2023年のACM-IEEE CSジョージ・マイケル記念HPCフェローシップの受賞者が発表されました」

「ACMとIEEEは、2023年のACM-IEEE CSジョージ・マイケル記念HPCフェローシップの受賞者を発表しました」

このAI論文は、大規模な言語モデルを最適化する秘訣を明らかにします:報酬のバランスと過剰最適化の防止

UC Berkeley、UCL、CMU、Google Deepmindの研究者チームは、複数の単純な報酬モデルから導かれた合成報酬モデルを使用して、大規模な言語モデルの最適化の課題に取り組んでいます。これらのハイブリッドモデルは、成分モデルの適切な重み付けの支援を必要とすることが多く、報酬が高いほど人間の評価が悪くなる過度の最適化が起こります。彼らの方法は、制約付き強化学習を使用して、エージェントが各成分モデルの有用性の閾値を超えないようにする解決策を提案しています。 この研究は、制約を強化学習に統合するための広範な研究の歴史を参照しています。Borkar、Padakandla、Cheung、Lecarpentierなどの著者の研究を挙げています。また、報酬関数の非定常性に取り組む重要性を強調し、Moskovitz、O’Donoghue、Tarbouriechの研究を引用しています。さらに、正則化ポリシーオプティマイゼーションの使用についても議論しています。 LLM(大規模言語モデル)は自然言語処理において優れた性能を発揮しますが、安全な展開や人間の好みとの整合性に問題があります。人間のフィードバックからの強化学習(RLHF)は、人間の選択を模倣した報酬モデルを使用してLLMを適応させます。しかし、報酬モデルの過度の最適化はテキストの品質低下につながることがあります。彼らの研究では、過度の最適化を解決するための合成報酬モデルを提案し、プロキシポイントを特定し、制約付き最適化を使用しています。動的な重み付けは、各報酬モデルが学習プロセスに与える影響を制御します。 この分析では、Lagrange乗数を使用して合成報酬モデルにおける過度の最適化を管理する制約付き強化学習を紹介しています。成分報酬モデルに制約を課し、効果的な人間評価範囲内に保ちます。プロキシポイントを特定し、報酬モデルの過剰使用を防ぐための適応的な勾配フリーな最適化手法が提示されています。KL divergenceを含む、さまざまなタスク報酬および制約の閾値の定式化も考慮されています。 彼らのアプローチは、合成報酬モデルにおける過度の最適化に関する初めての研究を行い、相関の重要性が過度の最適化ポイントに与える影響を明らかにしています。報酬モデルの閾値を超えることを防ぐために、適応的な勾配フリーな最適化手法が使用されています。制約付き強化学習の実装には、PPO-SATやAll-PPOを含むPPOアルゴリズムが議論されています。さまざまなタスク報酬および制約の閾値の定式化をカバーする詳細な疑似コードも提供されています。 この研究は、言語品質評価に影響を与える合成報酬モデルの最適化の課題を解決することに焦点を当てています。過度の最適化ポイントを特定し、最適化するために適応的な勾配フリーな最適化手法を使用しています。PPO-SATやAll-PPOなどのPPOアルゴリズムの実装について探究し、成分報酬モデル間の適切な重み付けと相関の考慮の重要性を強調しています。 今後の研究では、ReLOADなどの信頼性のある手法を適用して、合成報酬モデルにおける過度の最適化に取り組むことが検討されるべきです。確定的な最適ポリシーのない場合にモデルの出力問題を防ぐためにCMDPの形式を利用することの有用性を探求することが重要です。さまざまなドメインや複雑な合成報酬モデルを対象とした幅広いテストが必要です。代替の強化学習手法の調査や、重み付け戦略や相関指標が提案手法の性能に与える影響を評価することは、さらなる進展に重要です。

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us