Learn more about Search Results A - Page 109

これは本当のマルチモーダル学習ですか?-ImageBindについて説明します

「画像からテキストへの変換や音声からテキストへの変換、それが昨年のマルチモーダル学習です!Meta AIのImageBind [1]これこそが本当のマルチモーダル学習です!ImageBindは複数のモダリティを1つに統合します...」

「Cheat Sheetつきで始めるグラフデータベースクエリ」

グラフデータベースは、企業のIT組織における分析ツールセットの中で急速に重要な役割を果たしていますもしSQLを知っているのであれば、簡単にCypherを学ぶことができ、データ分析のための大きな機会を開拓することができます

「AWS 研究者がジェミニを紹介:大規模な深層学習トレーニングにおける画期的な高速障害回復」

ライス大学とAmazon Web Servicesの研究者チームが、GEMINIと呼ばれる分散トレーニングシステムを開発しました。このシステムは、大規模な機械学習モデルのトレーニングにおける障害復旧を改善することを目指しています。このシステムは、チェックポイントにCPUメモリを使用することにより、高い可用性を確保し、トレーニングの妨げを最小限に抑えるという課題に取り組んでいます。GEMINIは既存の解決策に比べて大幅な改善を示しており、大規模なディープラーニングモデルのトレーニングにおける有望な進歩となっています。 GEMINIは、大規模モデルのトレーニングにおける障害復旧プロセスの改善を目指して分散トレーニングシステムを導入しました。以前の解決策は、帯域幅とストレージの制約によりチェックポイントの頻度とモデルの精度に影響を与えていました。しかし、PyTorchやTensorFlowなどのディープラーニングフレームワークが提供するチェックポイントインターフェースを使用しても、それらの制約が存在しました。GEMINIのアプローチは、チェックポイントの配置とトラフィックスケジュールを最適化することで、この分野での貴重な進歩となっています。 特に大規模なディープラーニングモデルのトレーニングは、その複雑さと時間の消費のために改善が必要であると認識されています。大規模モデルのトレーニングにおける障害復旧の現行の解決策は、リモートストレージの帯域幅の制約により、著しい障害復旧コストが発生します。GEMINIは、迅速な障害復旧を可能にする革新的なCPUメモリテクニックを導入しています。GEMINIの最適なチェックポイントの配置戦略とトラフィックスケジューリングアルゴリズムにより、既存の解決策よりも著しく速い障害復旧が実現されています。GEMINIは、ディープラーニングの研究領域において注目すべき貢献をしています。 GEMINIはDeep-Speed上に構築されており、分散トレーニングのためのZeRO-3設定が使用されます。GPUモデルの状態管理にはAmazon EC2 Auto Scaling Groupsが使用されています。チェックポイントはCPUメモリとリモートストレージに保存され、3時間ごとにチェックポイントが行われます。GEMINIは、ほぼ最適なチェックポイント配置戦略を採用し、干渉を減らすトラフィックスケジューリングアルゴリズムを使用しています。評価はNVIDIA GPU上で行われますが、AWS Trainiumなどの他のアクセラレータにも適用されます。 GEMINIは既存の解決策を13倍以上も上回る障害復旧の改善を実現しています。評価結果は、トレーニングスループットに影響を与えることなく、時間の浪費を減らす効果を証明しています。GEMINIの拡張性は、さまざまな障害頻度やトレーニングスケールにわたって示されており、大規模な分散トレーニングの可能性を示しています。GEMINIのトラフィック交錯アルゴリズムは、トレーニングスループットに肯定的な影響を与え、システムの効率をさらに向上させています。 大規模なモデルのトレーニングにおける障害復旧の既存の解決策は、リモートストレージの帯域幅の制約により、高いチェックポイントの頻度を設定することができず、著しい時間の浪費が生じています。この研究は、静的かつ同期的なトレーニングと固定の計算リソースに焦点を当てており、弾力的かつ非同期的なトレーニングメソッドを考慮していません。また、障害復旧以外の目的でチェックポイント履歴を保存するためのCPUメモリサイズの問題は、現在の研究では取り上げられていません。 GEMINIは、高速かつ信頼性のある障害復旧を提供する効率的でスケーラブルな分散トレーニングシステムです。CPUメモリへのチェックポイント保存と先進的な配置戦略により、高いチェックポイントの頻度を実現しています。これにより、トレーニングスループットに影響を与えることなく時間の浪費を減らすことができ、GPUクラスタ上の大規模な分散トレーニングに優れた解決策となっています。

Google AIは、アクティブノイズキャンセリング(ANC)ヘッドフォンのための人工知能搭載の革新的な心臓モニタリングモダリティである音響脈波計(APG)を導入します

コンシューマーエレクトロニクスと健康技術の分野において、活発なノイズキャンセリング(ANC)ウェアラブルに健康モニタリング機能を組み込むことが注目されるようになりました。しかし、従来の方法では、補助センサーの統合が必要となり、複雑なハードウェア構成やバッテリー寿命の犠牲を強いられることがしばしばありました。これらの課題に対応するため、Googleの研究チームは、追加のハードウェアコンポーネントを必要とせずに、ANCウェアラブルが堅牢で正確な心拍モニタリングを行うことができる画期的な技術であるAudioplethysmography(APG)を紹介しました。この革新的な手法は、コンシューマー向けの健康センシングの風景を再定義する可能性があり、心拍数や心拍変動のモニタリングに有望でアクセスしやすい解決策を提供しています。 APGの登場前、ANCウェアラブルで健康モニタリングのためにさまざまなセンサーやマイクロコントローラーを統合することは、特にデザインの複雑さとコストの面で重大な課題を提起しました。研究チームは、低強度の超音波信号をヘッドフォンのスピーカーから送信し、フィードバックマイクロフォンで変調されたエコーを捕捉するというAPGを用いた画期的な方法を提案しました。この革新的な技術により、イヤーカナルの微妙な変化を検出し分析することが可能となり、デバイスの全体設計やバッテリー寿命を犠牲にすることなく、ユーザーの心臓活動に貴重な洞察を提供します。 APGは円筒共鳴モデルを活用し、ユーザーの心拍を密接に反映する脈波状の波形を抽出することができます。チャネルの多様性と相干検出を活用することで、APGは動きによるアーティファクトに対する耐性を向上させ、さまざまな身体活動中でも信号品質を向上させ、正確なモニタリングを実現します。研究チームは、APGの効果を心拍数や心拍変動の計測において成功裏に実証しました。これにより、コンシューマーグレードのANCヘッドフォンを通じた低コストの健康モニタリングの有望で信頼性の高い方法となりました。 APGの実装は、既存の方法に関連する制約を克服しながらも、デバイスのパフォーマンスや設計の複雑さを損なうことなく、消費者の健康センシングにおける重要な進展を示しています。超音波技術の力を活用することで、研究チームは、ユーザーのダイナミックな身体活動や多様な身体特性においても、APGが堅牢で正確であることを実証しました。このブレイクスルーは、コンシューマーグレードのANCヘッドフォンでの健康センシング技術の広範な普及の可能性を切り拓くものであり、より広範な人々にとって、健康モニタリングをよりアクセスしやすく便利なものにすることができます。 さらに、APGの独自の利点は、その技術的な能力を超えて広がっています。従来の方法では、さまざまな肌のトーンやイヤーカナルのサイズに対応することに課題を抱えることがよくありますが、APGはそのようなバリエーションに対して非常に強い耐性を示します。この包括性により、多様なユーザーベースに対してAPGのアクセス性と適用性を高めることができ、その利点を幅広い人々が享受できるようになります。 まとめると、APGの導入は、ハイアブルヘルスセンシングにおける重要なマイルストーンを示しています。追加のセンサーや複雑なハードウェア設定なしに心臓活動を正確にモニタリングできる能力は、消費者の健康モニタリングを革新する可能性を示しています。既存の方法による課題に対処し、多様なユーザー特性に対する非常に強い耐性を示すことで、APGは低コストかつ効果的な健康モニタリングの新たな道筋を開き、幅広いユーザーにとって有望でアクセスしやすい技術となります。

ヴェクタラは、AI言語モデルの「幻覚」をベンチマーク化し、対処するための画期的なオープンソースモデルを立ち上げます

急速に進化するGenerative AI(GenAI)領域での責任追及を促進する前例のない取り組みとして、Vectaraはオープンソースの幻覚評価モデルを公開しました。これは、Large Language Models(LLMs)の事実に基づく正確性の測定を標準化するための重要な一歩であり、LLMsによる真実からの逸脱である「幻覚」の度合いを測定するための商業およびオープンソースのリソースを提供します。 この公開は、透明性を強化し、主要なGenAIツールの幻視リスクを定量化する客観的な手法を提供することを目的としており、責任あるAIの促進、誤情報の緩和、効果的な規制の基盤を築くための重要な措置です。幻視評価モデルは、提供された参考資料に基づくコンテンツの生成時にLLMsがどれだけ事実に基づいているかを評価するうえで、重要なツールとなるでしょう。 Vectaraの幻覚評価モデルは、Apache 2.0ライセンスに基づいてHugging Face上でアクセス可能であり、LLMsの事実的な完全性を明確に示しています。これ以前は、LLMベンダーがモデルの幻覚耐性に関する主張を検証する手段がほとんどありませんでした。Vectaraのモデルは、最新の幻覚研究の進歩を活用して、客観的にLLMの要約を評価します。 公開には、Vectaraのチームがオープンソースコミュニティと協力して維持しているLeaderboard(GenAIの正確さに対するFICOスコアに似たもの)が付属しています。これにより、LLMsは標準化された一連のプロンプトでのパフォーマンスに基づいてランク付けされ、ビジネスと開発者にとって有益な情報を提供します。 Leaderboardの結果からは、OpenAIのモデルが現在のパフォーマンスでリードし、Llama 2モデルが続いており、CohereとAnthropicも力強い結果を示しています。しかし、GoogleのPalmモデルのスコアは低くなっており、領域の持続的な進化と競争を反映しています。 Vectaraのモデルは幻覚への解決策ではありませんが、より安全かつ正確なGenAIの導入のための決定的なツールです。その導入は、米国大統領選挙などの重大なイベントに向けて、誤情報のリスクに関する関心が高まる時期に行われました。 幻覚評価モデルとLeaderboardは、業界および規制当局の待望の標準的な基準を提供することで、GenAIの規制にデータ駆動のアプローチを促進するうえで重要な役割を果たすことが期待されます。

エンドトゥエンドの実験設計をA/Bテストを用いて行う

もし実験的なデザインやA/Bテストについて疑問があるなら、まさに正しい記事に来ましたこの記事は、最初の実験の準備をするために必要な手順を案内します...

ミシガン大学の研究者は、AIの心理理論において新領域を開拓し、分類法と厳密な評価プロトコルを明らかにしました

ミシガン大学の研究者チームは、大規模言語モデル(LLM)のマインド理論(ToM)能力を評価するための新しい基準と評価プロトコルの開発を提唱しています。この研究では、機械のToMを7つの心的状態のカテゴリに分類する包括的かつ状況依存的な評価手法を提案しています。この研究は、LLMにおける心的状態の総合的な評価の必要性を強調し、それらを物理的および社会的な文脈の中でエージェントとして扱います。 この研究は、LLMにおける確固たるToMの不足と、改善された基準と評価方法の必要性について言及しています。既存の基準の不備を指摘し、LLMをさまざまな文脈でエージェントとして扱う包括的な評価手法を提案しています。機械のToMに関する現在の議論に焦点を当て、その限界とより確かな評価方法の必要性を強調しています。この研究は、ToMをLLMと統合し、評価の環境を改善するための将来の研究に指針を示すことを目指しています。 ToMは人間の認知と社会的推論に不可欠であり、AIにおいて社会的な相互作用を可能にするための重要性が問われています。Chat-GPTやGPT-4などのLLMが機械のToMを持っているかどうかを問い、複雑な社会的および信念推論のタスクにおけるその限界を強調しています。既存の評価プロトコルを見直し、包括的な調査が必要となります。実世界の文脈においてLLMをエージェントとして扱う機械のToMのタクソノミーと状況依存的な評価手法を提唱しています。 この研究では、機械のToMのためのタクソノミーを提案し、LLMのための状況依存的な評価手法を提唱しています。既存の基準を見直し、知覚的な視点の取り組みについての文献調査を行っています。グリッドワールドにおけるパイロットスタディをコンセプトの証明として紹介しています。研究者たちは、ショートカットやデータの漏洩を避けるために注意深いベンチマークの設計の重要性を強調し、現在のベンチマークの制約を限られたデータセットへのアクセスの制限として指摘しています。 この手法は、7つの心的状態のカテゴリを持つ機械のToMのためのタクソノミーを提案しています。ショートカットやデータの漏洩を防ぐために、LLMのための包括的かつ状況依存的な評価手法を提唱しています。コンセプトの証明として、グリッドワールドでのパイロットスタディを行っています。現在のToMのベンチマークの制約を強調し、高品質な注釈とプライベートの評価セットを備えた新しいスケーラブルな基準の開発の必要性を強調しています。公正な評価の実施と、より包括的な基準の計画も推奨しています。 まとめると、この研究では、LLMにおける機械のToMを評価するための新しいベンチマークの必要性が強調されます。実世界の文脈でLLMをエージェントとして考える包括的かつ状況依存的な評価手法が提唱され、ショートカットやデータの漏洩を防ぐためのベンチマークの慎重なキュレーションの重要性も強調されます。この研究では、高品質な注釈とプライベートの評価セットを備えたより大規模なベンチマークの開発と、将来のシステマティックなベンチマークの開発の計画も明らかにされています。 将来の研究の課題として、未開拓の側面に対応し、ショートカットを断たせ、品質の高い注釈とスケーラビリティを確保する新しい機械のToMのベンチマークが必要です。公正な評価に重点を置きながら、プロンプトを文書化し、モデルがさまざまな文脈でエージェントとして扱われる状況依存的なToMの評価方法を提案します。複雑な評価プロトコルを状況依存的なセットアップで実装することを推奨します。パイロットスタディの制限を認識しながら、将来的には体系的で大規模なベンチマークを実施する計画も立てています。

テキスト生成の新時代:RAG、LangChain、およびベクトルデータベース

はじめに 革新的な技術によって、自然言語処理の急速に変化するランドスケープの中で、機械が人間の言語を理解し生成する方法が常に再構築されています。そのような画期的なアプローチの1つが、Retrieval Augmented Generation(RAG)です。これは、GPT(Generative Pretrained Transformer)などの生成モデルのパワーとベクトルデータベースとLangchainの効率を組み合わせています。 RAGは機械が言語を処理する方法のパラダイムシフトを象徴し、従来に比べて類前の文脈理解と反応性を実現するために生成モデルと検索モデルの隔たりを埋める役割を果たしています。このブログ記事では、RAGのコアコンセプト、GPTモデルとの統合、ベクトルデータベースの役割、および現実世界での応用について説明します。 学習目標 Retrieval Augmented Generation(RAG)の基礎を理解する。 ベクトルデータベースとそのベクトルを使用した革新的なデータ保存および検索手法に洞察する。 RAG、LangChain、およびベクトルデータベースがユーザーのクエリを解釈し、関連情報を取得し、一貫した応答を生成するためにどのように連携するかを理解する。 特定の応用に統合されたテクノロジーの実践スキルを開発する。 この記事はData Science Blogathonの一部として公開されました。 RAGとは何ですか? Retrieval Augmented Generation(RAG)は生成モデルと検索モデルを融合させたものです。これにより、生成モデルの創造的な能力と検索システムの正確さをシームレスに組み合わせることで、多様で文脈に即したコンテンツの生成が可能となります。 テキストの補完や質問応答など、一部の従来の言語生成タスクでは、GPT(Generative Pretrained Transformer)などの生成モデルが豊富なトレーニングデータセットに基づいて文脈に即したテキストを生成する能力が優れていることが示されています。しかし、入力コンテキストが曖昧であるかデータが不足している場合、誤った応答や一貫性のない応答を生成する可能性があります。…

広告主向けのAIパワードイメージ生成ツールを試験的に導入中のAmazon

広告主がマーケティングコンテンツを作成する方法を革新するために、Amazonは先進のAI技術を広告およびマーケティングツールに統合する先駆的な取り組みを始めました。この画期的な開発により、広告主は平凡な製品画像やコピーライティング素材を魅力的な広告ビジュアルに変えることができます。 電子商取引大手の子会社であるAmazon Adsは、広告用画像生成AIツールの試験を開始したことを明らかにしました。このツールは、消費者に響くダイナミックな広告イメージに対して、単調な製品写真を活気づけることを約束しています。 今年早くにAmazonが依頼した調査によると、広告主の主な課題は、魅力的な広告クリエイティブの制作や適切なクリエイティブ形式の選択に関するものであると、回答者の約75%が表明しました。Amazonの初期テストもこの問題の重要性を示しています。たとえば、モバイルデバイスでスポンサードブランド広告で同じトースターを宣伝する際、トースターを空白の背景に対してキッチンのシーンに配置する選択肢は、後者のクリック率が40%高くなりました。 チームは、魅力的で独自の広告クリエイティブを作ることはしばしば大きなコストがかかる場合があり、追加の専門知識が必要になるかもしれないと強調しています。この課題に対応するため、Amazonは技術的な専門知識を必要とせず、あらゆるバックグラウンドの広告主が魅力的なビジュアルを簡単に作成できる画像生成AIツールを導入しました。 広告主は、このツールを利用することは簡単です。Amazon広告コンソールで製品を選択し、「生成」をクリックするだけです。ツールは、ブランドのアイデンティティとライフスタイル要素を取り入れた画像のセットを自動的に生成します。さらに、広告主はテキストのプロンプトを入力して画像コンテンツをカスタマイズすることもできます。 Amazon Adsは、現在Amazonプラットフォームに登録されている販売業者、サプライヤー、書籍販売業者、出版社、プログラム開発者、広告代理店など、多様なステークホルダーを対象にしています。この画像生成ツールの範囲は、現在は一部のテスト広告主に限定されているため、テストフェーズにあるものです。しかし、近い将来、利用範囲を拡大する計画が進行中です。 売り手の内容作成を円滑にするための並行した取り組みとして、Amazonは今年9月にテキスト生成サービスを導入しました。セラーセントラルからアクセス可能なこのサービスは、魅力的な商品説明を作成するプロセスを効率化します。売り手は、自社の商品についてのいくつかの言葉や文章を入力し、システムが自動的に編集可能な高品質なテキストを生成します。 AIパワーを活用したコンテンツの作成へのAmazonの参入は、広告クリエイティブのプロセスを民主化する大きな進展です。AIの力を利用した直感的なツールを広告主に提供することで、電子商取引の巨人は、あらゆる規模のビジネスにとってよりアクセス可能で効果的なデジタル広告の景観を再構築する準備が整っています。このテクノロジーが進化し続けるにつれて、商品がデジタル領域でマーケティングや販売される方法が変革される可能性を秘めています。 この投稿は、Amazon Pilots AI-Powered Image Generation Tool for Advertisers が最初に掲載されたもので、MarkTechPost により提供されました。

「Googleの「この画像について」機能:AI生成の誤情報への解決策」

AI生成の画像が氾濫する世界では、深刻な問題が浮上しています – 誤情報の拡散です。これらの非常にリアルな画像は、実際のものと区別がつかず、インターネット上で大混乱を引き起こす可能性があります。AI生成コンテンツの時代には、画像の真正性を識別し、デジタルの風景を虚偽と欺瞞から守る堅牢な解決策が必要となります。 AI生成画像の誤情報の問題に取り組むため、さまざまな試みが行われてきました。AI生成画像情報をメタデータに含めるなどの注目すべき進歩により、画像の起源や真正性を特定するのに役立ちました。ただし、このアプローチはメタデータにアクセスし解釈できる人に限定され、よりアクセスしやすくユーザーフレンドリーな解決策のギャップがありました。 この課題に対するGoogleの革新的な対応策 – 検索の「この画像について」という機能。この機能は、ユーザーに画像の真正性を簡単に確認するパワーを与えることを目指しています。画像の包括的な履歴を提供し、他のウェブサイトがどのように使用し記述しているかを明らかにし、もっとも重要なことに、ボタンをタップするだけで画像のメタデータにアクセスすることを可能にします。このツールにより、ユーザーはインターネット上の画像の真正性を簡単に特定できるようになり、画像とのインタラクションの方法を革新します。 Googleの「この画像について」という機能に関連するメトリックは、その素晴らしい機能を表しています。リリース以来、ベータユーザーの70%以上が、画像の事実確認における調査時間の大幅な短縮を報告しています。これは、このツールの効率性とユーザーフレンドリーさを証明するものであり、AI生成画像の誤情報の成長への懸念に対処するための効果的なソリューションであることを強調しています。 結論として、AI生成画像の台頭により、デジタル領域における誤情報の切迫した問題が浮かび上がりました。この問題を軽減するための試みは行われてきましたが、Googleの「この画像について」という機能はゲームチェンジャーとして浮上しており、ユーザーに画像の真正性を判断するための強力でアクセスしやすいツールを提供しています。その印象的なメトリックとユーザーフレンドリーなインターフェースにより、AI生成画像の誤情報の課題に対する頼もしい解決策となり、デジタル世界の真実と信頼性を保護します。 この投稿はGoogleの「この画像について」機能:AI生成誤情報への解決策に最初に掲載され、MarkTechPostで報告されました。

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us