Learn more about Search Results A - Page 43

「PyTorchでのSoft Nearest Neighbor Lossの実装方法」

表現学習は、深層ニューラルネットワークによって与えられたデータセット内の最も顕著な特徴を学習するタスクです通常は教師あり学習の範囲で暗黙的に行われる課題であり、それは...

「データプロジェクトを始めるための3つの強力なPythonライブラリを(一部)自動化して、EDAを手助け」

「ごみを出すにはごみを入れる」という古い格言を避けるためには、データを理解し、きちんと整理することに十分な時間を費やすことが重要です最近、私はコンラッドの著書「The Kaggle Book」を読みました

「ジェンAI愛好家が読むべき5冊の本」

イントロダクション 技術がますます進化する中、人工知能(AI)の領域は拡大するだけでなく、ジェネラティブAIという様々なサブフィールドにも多様化しています。創造性とAIの融合であるジェンAIは、世界中の産業を変革する準備が整っています。業界の予測によると、ジェンAIセクターは2032年までに驚くべき1.3兆ドルの産業に成長すると予想されています。自身の専門分野を築きたいという意欲的なプロフェッショナルのために、独占的な書籍のページの中には待ち望まれる知識がたくさんあります。ここでは、ジェンAI愛好家が読むべき必須の5冊を厳選して紹介します。 「The Artificial Intelligence and Generative AI Bible:[5 in 1] 最も最新かつ完全なガイド」 by Alger Fraley 評価:4.4 『The Artificial Intelligence and Generative AI Bible』は、ジェンAIの複雑な領域を簡素化した包括的な書籍です。AIの基礎、深層学習、NLP、倫理、そして将来の応用に分割された5つの必須セクションで構成されています。この本は複雑な概念を分解し、多様な産業にわたる実践的な洞察と現実の例を提供します。理論だけでなく、倫理的な考慮事項を説明し、AIの潜在的な影響を紹介します。将来に焦点を当てたアプローチで、読者の好奇心を刺激し、革新的な解決策にAIの力を活用する力を与えます。初心者から専門家まで、AIの変革的な能力を理解し活用するための指南となります。 「Ripples…

「AIは本当に私たちの感情を理解できるのか? このAIの論文では、ビジョン・トランスフォーマーモデルを用いた高度な顔の感情認識について探求されています」

以下のHTMLコードを日本語に翻訳してください: FERはヒューマンコンピュータインタラクション、感情分析、感情計算、仮想現実において重要な役割を果たしています。それは機械が人間の感情を理解し、対応するのを支援します。手法は、マニュアルの抽出からCNNおよびトランスフォーマーベースのモデルへと進化しています。応用にはヒューマンコンピュータインタラクションの改善やロボットの感情応答の向上などがあり、FERは人間と機械のインターフェース技術において重要です。 FERの最先端の手法は大きく変化してきました。初期のアプローチは手動で作成された特徴量とサポートベクターマシンやランダムフォレストなどの機械学習アルゴリズムに大きく依存していました。しかし、ディープラーニング、特に畳み込みニューラルネットワーク(CNN)の登場により、FERは複雑な表情の空間パターンを巧みに捉えることができるようになりました。それらの成功にもかかわらず、画像の品質、照明条件の変動、人間の表情の複雑さなど、対照度の変動、クラス間のバランスの取れていないデータセット、目隠しなどの課題が依然として存在しています。さらに、FER2013リポジトリなどのデータセットのバランスの取れていない性質がモデルの性能に影響を及ぼしています。これらの課題の解決は、FERの精度と信頼性を向上させることを目指す研究者にとっての焦点となっています。 これらの課題に対応するため、最近の論文「Augmented Balanced Datasetsを使用した顔の感情認識におけるVision Transformerモデルの比較分析」は、FER2013のような既存のデータセットの制限に対処するための新しい手法を紹介しています。この研究では、異なるVision Transformerモデルのパフォーマンスを顔の感情認識において評価することを目的としています。また、拡張とバランスの取れたデータセットを使用してこれらのモデルを評価し、顔の表情に正確に感情を認識する能力を確認することに重点を置いています。 具体的には、提案された手法は、FER2013リポジトリから品質の低い画像を洗練させ、水平反転、トリミング、パディングなどの高度なデータ拡張手法を用いて新しいバランスの取れたデータセットを作成することが含まれています。この新しいバランスの取れたデータセットであるFER2013_balancedは、データの不均衡を正し、さまざまな感情クラスの間で公平な分布を確保することを目指しています。データの拡張と品質の低い画像の除去により、研究者はデータセットの品質を向上させ、したがってFERモデルのトレーニングを改善することを意図しています。この論文では、データセットの品質がバイアスの予測を緩和し、FERシステムの信頼性を高める上での重要性について詳しく説明しています。 最初に、この手法ではFER2013データセットから品質の低い画像を特定し、除外しました。これには対比度の低い画像や目隠しのある画像などが含まれており、これらの要因はそのようなデータセットでトレーニングされたモデルのパフォーマンスに大きく影響します。その後、クラスの不均衡問題を軽減するために拡張が行われました。この拡張は、代表されていない感情の表現を増やすことを目指し、FER2013_balancedデータセット内の各感情カテゴリに対して画像数を均等にすることを目指しました。 この後、この手法では幸せ、中立、悲しみなどの過剰なクラスから多くの画像を削除することでデータセットをバランスさせました。この手順により、FER2013_balancedデータセット内の各感情カテゴリについて画像の数を均等にすることを目指しました。バランスの取れた分布は、多数派クラスに対するバイアスのリスクを軽減し、FER研究のより信頼性のある基準を確保します。データセットの問題を解決することへの重点は、顔の感情認識の研究における信頼性の高いスタンダードを確立する上での重要な役割を果たしています。 この手法により、バランスの取れたデータセットの構築後、Tokens-to-Token ViTモデルのパフォーマンスが顕著に向上しました。このモデルは、FER2013_balancedデータセットで評価された際に、オリジナルのFER2013データセットに比べて高い精度を示しました。分析はさまざまな感情カテゴリを網羅しており、怒り、嫌悪、恐怖、中立的な表現に対して大きな精度向上が示されています。Tokens-to-Token ViTモデルは、FER2013_balancedデータセットで74.20%の総合精度を達成し、FER2013データセットでの61.28%に対して、提案手法のデータセット品質の向上とそれによる顔の感情認識タスクのモデルのパフォーマンスの改善の効果を強調しています。 まとめると、著者はデータセットの品質を向上させることによりFERを向上させる画期的な手法を提案しました。そのアプローチは品質の低い画像を入念にクリーニングし、高度なデータ拡張技術を用いてバランスの取れたデータセットFER2013_balancedを作成することを含んでいます。このバランスの取れたデータセットは、Tokens-to-Token ViTモデルの精度を大幅に向上させ、データセットの品質がFERモデルのパフォーマンス向上において重要な役割を果たすことを示しています。この研究は、データセットの入念なキュレーションと拡張がFERの精度向上に与える重要な影響を強調し、ヒューマンコンピュータインタラクションと感情計算の研究において有望な展望を開いています。 記事「AIは本当に私たちの感情を理解できるのか?このAI論文はビジョントランスフォーマーモデルを使用した高度な顔の感情認識を探求します」は、MarkTechPostで最初に掲載されました。

マイクロソフトの研究者がConfidential Consortium Framework (CCF)を紹介:セキュアな状態を持つCIAアプリケーションを開発するための汎用AIフレームワーク

「CIA Trinity(CIAトリニティ)」は、よく知られた情報セキュリティフレームワークであり、データの機密性、整合性の保護、高い可用性の3つの属性で構成されています。各属性から始めて、研究チームは信頼性の高い多者参加アプリケーションを信頼できないインフラストラクチャ上で実行することに焦点を当てています。個人データのプライバシーを保護する責任は組織にあります。この責務は法律によってますます規制されるようになり、実施しない場合の影響は、たとえばGDPRの場合には売上高の4%になる可能性があります。企業は知的財産を保護したり、競争力を獲得したり、秘密を守る必要がある場合でも、データを秘密に保つことを望む場合があります。 実行中の秘密はより難しいですが、静止状態と飛行中の暗号化は試された方法です。さらに、秘密は単独では部分的にしか解決されません。むしろ、任意のデータを保護する問題をキーの保護にまで縮小し、そのキーは一連の確立されたガイドラインに従って制御、保管、発行される必要があります。これは整合性の保護です。組織は、自らの管理下のデータを違法または偶発的な変更から保護し、データの機密性を維持するという二重の責任を負います。データにアクセスするコードの整合性の維持は、データの秘密を維持するために頻繁に必要とされます。コードの整合性と透明性を組み合わせることで、データを共有するパーティーは情報の意図した使用方法に合意することができます。 たとえば、銀行は政府のために要求を処理することで反マネーロンダリング法に従うことができますが、顧客の完全な情報は提供しません。クラウドコンピューティングの広範な普及により、アプリケーションに低い参入障壁とコストの比例的な拡張性を提供するため、これらのシステムの信頼できる計算基盤(TCB)は時間の経過とともに拡大しています。信頼できないクラウドインフラストラクチャを使用する場合、リモートでデータの整合性と機密性を確保することはより困難です。そのため、健康、金融、または政府に関連するような非常に敏感なアプリケーションは、パブリッククラウドに移行することができません。 この困難な状況を考慮すると、次の研究課題にはまだ回答が必要です:クラウドプロバイダを多者参加アプリケーションのTCBから排除しつつ、開発者がクラウドの計算とストレージリソースを活用できるようにすることは可能でしょうか?多者参加シナリオの需要が増える中で、互いに完全に信頼しないパーティー間でデータシステムを統合することは特に重要です。多くのソースからのデータを統合し、それを協力して利用して価値を向上させ、新しいユースケースを作成することができます。ただし、機密性と整合性には制約があり、研究チームは複数の異なる参加者のニーズとアクセス権限を考慮する必要があります。 現代のデジタルインフラストラクチャがますます重要になっているため、アプリケーションは信頼性があり、高い可用性が求められます。デジタルインフラストラクチャは、必要な一貫性とコストトレードオフであっても、100%の利用可能性を保証することはできませんので、通常の運用中に予想される障害に対して堅牢である必要があります。研究チームは、非常に実用的でありながら倫理的に優れたアプローチを取る必要があります。これには、信頼できないクラウドインフラストラクチャや多者参加の信頼できないガバナンスなど、様々な状態保持アプリケーションや現代の展開シナリオをサポートするCIAアプリケーションの作成が含まれます。 マイクロソフト、KU Leuven、ケンブリッジ大学の研究チームは、この研究のConfidential Consortium Framework(CCF)を提案しています。CCFは、分散トラストと集中クラウドコンピューティングを統合しています。リモートで証明可能な機密性と整合性により、CCFはクラウドベースの信頼性の高い実行環境を利用しています。さらに、トランザクションキーバリューストアとステートマシンレプリケーションは、高い可用性と監査を実現するために不変の台帳と組み合わせられています。CCFの柔軟性により、開発者は高度に調整可能な監視のために独自の多者参加ガバナンスアーキテクチャを使用し、アプリケーションロジックを適用することができます。 クラウドコンピューティングや多者参加協力において、この研究チームはデータの機密性、整合性の保護、高い可用性などを探求する多くの研究チームの1つです。CCFは、多くの先行システムとは異なり、孤立した安全な実行ソリューション(代わりに二次的なストレージシステムに依存)または孤立したデータストレージソリューション(台帳、データベース、またはキーバリューストアの形式)のいずれかを提供するのではなく、実行とストレージの両方を可能にするエンドツーエンドのソリューションを提供します。CCFは、信頼できる計算基盤、柔軟性のあるプログラミングアプローチ、セキュリティと使いやすさのバランスを備えています。さらに、CCFは、スナップショット、ライブコード更新、再構成、災害復旧、インデックスなどの機能に依存するAzure Managed CCFやAzure Confidential Ledgerなどのサービスを通じて本番環境で信頼されています。これは、汎用で自己完結型の設計の重要性を強調しています。

グーグルとUIUCの研究者は、単独でトレーニングされたスタイルとサブジェクトのLoRAをシームレスに統合するための革新的な人工知能手法であるZipLoRAを提案しています

Google ResearchとUIUCの研究者は、新しい手法である独立にトレーニングされたスタイルと主題のLinearly Recurrent Attentions(LoRAs)を統合することで、テキストから画像への拡散モデルにおける個別の作成物の制御の問題に対処するZipLoRAを提案しています。これにより、任意の事柄を生成するためのより大きな制御力と効果が可能になります。この研究では、概念個別化LoRA重み行列におけるスパース性の重要性を強調し、ZipLoRAのコンテント-スタイル転送や再文脈化などの多様な画像スタイリゼーションタスクにおける効果を示しています。 写真写実性のある画像合成の既存の手法は、Stable Diffusion XL v1などの拡散モデルに頼っています。ZipLoRAのような方法は、潜在的な拡散モデル内で独立に訓練されたスタイルと主題のLoRAsを活用し、個別の作成物の制御を提供します。このアプローチは、シンプルで費用効果の高い主題とスタイルの個別化ソリューションを提供します。ベースラインおよび他のLoRA統合手法と比較して、ZipLoRAの実践では個別のスタイルを持つ多様な主題を生成することが示されました。 ユーザー指定の主題を個別のスタイルで高品質な画像を生成することは、拡散モデルにとって課題となっています。既存の手法は特定のコンセプトやテクニックに対してモデルを微調整することができますが、ユーザーが提供した主題やスタイルを支援する必要があります。この問題に対処するために、ZipLoRAというハイパーパラメータフリーの方法が開発されました。この方法は、効果的に独立してトレーニングされたスタイルと主題のLoRAsを統合し、前例のない制御を提供します。また、公開されているLoRAsの組み合わせを簡素化し、一貫性と堅牢性を提供します。 ZipLoRAは、拡散モデルで独立にトレーニングされたスタイルと主題のLoRAsを統合する方法です。ハイパーパラメータは必要ありませんが、主題とスタイルの個別化を可能にします。この技術は、シンプルな線形結合と最適化ベースの手法を用いた直接結合のアプローチを使用します。ZipLoRAは、コンテント-スタイル転送を含むさまざまなスタイリゼーションタスクで効果がありました。スカラーのウェイトを調整することで制御されたスタイリゼーションを可能にし、モデルが個々のオブジェクトとスタイルを正しく生成する能力を保持します。 ZipLoRAは、スタイルと内容の忠実度で優れており、コンテント-スタイル転送や再文脈化などの画像スタイリゼーションタスクで競合他社やベースラインを上回っています。ユーザースタディを通じて、正確なスタイリゼーションと主題の忠実度においてZipLoRAが優れていることが確認され、ユーザー指定の主題を個別のスタイルで生成するための効果的で魅力的なツールとなっています。ZipLoRAでは、独立にトレーニングされたスタイルとコンテンツLoRAsを統合することで、拡散モデル内の個別の作成物に対する前例のない制御を提供します。 まとめると、ZipLoRAは、主題とスタイルの同時個別化を可能にする非常に効果的で費用効率の高い手法です。ユーザースタディにおけるスタイルと主題の忠実度における優れた性能が確認され、LoRAウェイトのスパース性と整列に関して統合プロセスが分析されました。ZipLoRAは、前例のない制御を提供し、既存の手法を上回ります。

「誰がどの役職を担当しますか?AIの視点から見た職業の役割」

2020年12月、私はオックスフォード大学のグループとともに、生成言語モデルにおける偏見を調査する論文の執筆を開始しました私たちは職業や...

「Langchainを利用した半構造化データのためのRAGパイプラインの構築」

イントロダクション Retrieval Augmented Generation(RAG)は長い間存在しています。この概念を基にしたツールやアプリケーションが多数開発されており、ベクトルストア、検索フレームワーク、LLMなどがあり、カスタムドキュメント、特にLangchainを使用した半構造化データとの作業が容易で楽しくなっています。長くて密度のあるテキストとの作業はこれまでになく簡単で楽しいものとなりました。従来のRAGはDOC、PDFなどのドキュメントやファイル形式の非構造化テキストにはうまく対応していますが、PDFの埋め込みテーブルなどの半構造化データには対応していません。 半構造化データとの作業時には通常2つの問題が生じます。 従来の抽出およびテキスト分割方法ではPDFのテーブルを考慮していません。通常、テーブルが分割されてしまい、情報が失われます。 テーブルの埋め込みは正確な意味ベースの検索には適さない場合があります。 そのため、本記事ではLangchainを使用して半構造化データ用の検索生成パイプラインを構築し、これらの2つの問題に対処します。 学習目標 構造化、非構造化、半構造化データの違いを理解する。 RAGとLangchainの基本をおさらいする。 Langchainを使用して半構造化データを処理するためのマルチベクトル検索生成システムを構築する方法を学ぶ。 この記事はData Science Blogathonの一環として公開されました。 データの種類 通常、データには構造化データ、半構造化データ、非構造化データの3つのタイプがあります。 構造化データ:構造化データは標準化されたデータです。データは事前に定義されたスキーマ(行と列など)に従います。SQLデータベース、スプレッドシート、データフレームなどが該当します。 非構造化データ:非構造化データは、構造化データとは異なり、データモデルに従いません。データはランダムな形式となっています。たとえば、PDF、テキスト、画像などです。 半構造化データ:これは前述のデータタイプの組み合わせです。構造化データとは異なり、厳密な定義済みのスキーマを持ちませんが、データはいくつかのマーカーに基づいて階層的な順序を保持しています。これは非構造化データとは異なります。たとえば、CSV、HTML、PDFの埋め込みテーブル、XMLなどが該当します。 RAGとは何ですか? RAGはRetrieval Augmented Generation(検索拡張生成)の略であり、大規模言語モデルに新しい情報を提供する最も簡単な方法です。RAGについて簡単に説明しましょう。…

元アップル社員が生成型AIをデスクトップにもたらす方法

常に進化するテックのランドスケープの中で、元Appleの従業員であるコンラッド・クレイマー、キム・ベベレット、アリ・ウェインスタインの3人は、デスクトップにおける生産性を再定義する使命に取り組んでいます。彼らのスタートアップ、ソフトウェアアプリケーションズ社は、生成的AIの力を利用して、ワークフローのショートカットを作り出し、世界中のユーザーのタスクを効率化することを約束しています。 ビジョナリースタートアップの誕生 ソフトウェアアプリケーションズ社は、単なる他のテックスタートアップではありません。それは、デスクトップコンピューティングの未来を見て、それを実現しようと決意した元Appleの三人のビジョナリーの作品です。彼らの目標はシンプルでありながら野心的です:生成的AIを日常的なデスクトップアプリケーションに統合し、エンドユーザーにとって複雑なタスクを簡単にすることです。この三人はすでにOpenAIのAltman、FigmaのCEOであるディラン・フィールド、シリコンバレーの他の著名な人々から650万ドルの資金を調達しています。 新たなフロンティア 生成的AIはこのスタートアップの革新の基盤です。具体的なプログラミングが行われていない場合にも、生成的AIはデータから学び、作られていないコンテンツを作り出すことができます。つまり、このような技術の潜在的な応用範囲は広範であり、平凡なタスクの自動化から簡単なコマンドで複雑なレポートを生成することまで可能です。 詳細はこちらをご覧ください:生成的AIとは何か、そしてそれはどのように機能するのか ワークフローショートカット:ゲームチェンジャー このスタートアップの看板製品は、ワークフローショートカットに重点を置いています。これは通常のキーボードショートカットとは異なり、インテリジェントで文脈を理解し、適応するものです。ユーザーの利用習慣と好みを理解することで、これらのショートカットはニーズを予測し、単一のコマンドで複数のステップを実行することができます。これにより、貴重な時間を節約し、ユーザーの認知負荷を減らすことができます。 私たちのコメント ソフトウェアアプリケーションズ社によるこのイニシアチブは、生成的AIの変革的な力の証です。彼らはAppleの専門家の背景を活かして、デスクトップコンピューティングの将来において定番となる可能性のある製品を提供する準備が整っています。彼らが技術を開発し、磨き上げていくにつれ、私たちは生産性とワークフロー管理への影響を心待ちにしています。

dbtコア、Snowflake、およびGitHub Actions データエンジニアのための個人のプロジェクト

これは、Data/Analyticsエンジニア向けの簡単で高速なプロジェクトですdbt Core、Snowflake、Fivetran、およびGitHub Actionsなどの最新のデータスタックツールを試してみたい方にお勧めですハンズオン形式で行います...

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us