Learn more about Search Results 認証 - Page 19
- You may be interested
- 「AIレポート2023年」を解説する
- AIと自動化
- 「アニメート・ア・ストーリー:高品質で...
- 「なんでもセグメント:任意のオブジェク...
- マイクロソフトリサーチは、Florence-2と...
- 「大きな言語モデルの操作(LLMOps)とは...
- ノイズ除去オートエンコーダの公開
- 「MLOpsを活用した顧客離反予測プロジェク...
- 「ウェブポータル開発を加速させる8つの戦...
- 「Q4 Inc.が、Q&Aチャットボットの構...
- 「信じられないほどの新しい中間補間機能...
- 「アジア太平洋地域でAIスタートアップを...
- 「機械学習のための完璧なデータ注釈プロ...
- 「LLMOps対MLOps 違いを理解する」
- 「チャンドラヤーン3の着陸:AIとセンサー...
「ディープニューラルネットワークのデプロイのための自動チューニング」
「異なるニューラルネットワーク(NN)アーキテクチャを比較するために使用されるメトリックの1つは、それらをトレーニングするのにかかる時間です数時間かかりますか?数日かかりますか?数週間かかりますか?通常、これは更新するだけで改善できます...」
AIベースのアプリケーションテストのトップトレンドを知る必要があります
「AIアプリケーションのテストにおける最新のトレンドを把握しましょうこれらの必須のテスト方法で、AIアプリケーションの精度とセキュリティを向上させましょう」
Amazon SageMaker Model Cardの共有を利用して、モデルのガバナンスを向上させる
MLガバナンスの一環として利用可能なツールの1つは、Amazon SageMaker Model Cardsですこのツールは、モデルのライフサイクル全体でのドキュメントの集中管理と標準化を通じて、モデル情報の真実の単一ソースを作成する能力を持っています SageMakerモデルカードにより、モデルの設計、構築、トレーニング、評価からモデルのライフサイクルを可視化するために、モデルのドキュメント化方法を標準化することができますモデルカードは、監査やドキュメンテーションの目的で信頼性のあるビジネスおよび技術メタデータの真実の単一ソースとなることを目指していますモデルの重要な事実を提供するファクトシートとなります
制限から自由:MoMAでのマシン幻覚の検証
Refik Anadol Studioのリードデータサイエンティスト、クリスチャン・バークは、MoMAで展示された「Unsupervised」展での仕事の経験について語っています
「ニューヨーク大学の研究者が、人の見かけの年齢を画像内で変える新しい人工知能技術を開発しましたが、その人の独自の識別特徴を維持します」
AIシステムは、画像解析を使用して個人の年齢を正確に推定および変更するために、ますます使用されています。老化の変動に堅牢なモデルを構築するには、多くのデータと高品質の長期データセットが必要です。長期データセットとは、数年にわたって収集された多数の個人の画像を含むデータセットのことです。 多くのAIモデルがこのようなタスクを実行するために設計されていますが、多くの場合、個人の顔の特徴を保持しながら年齢属性を効果的に操作することに課題を抱えています。これらのシステムは、多くの年間を通じて個人を示す画像の大規模なトレーニングデータセットの作成という典型的な課題に直面しています。 NYU Tandon School of Engineeringの研究者たちは、個人の一意の生体認証情報を保持しながら、画像内の人物の見かけの年齢を変更するための新しい人工知能技術を開発しました。 研究者たちは、各個人の少数の画像セットでモデルをトレーニングしました。また、別の画像セットを使用して、キャプションによってその人物の年齢カテゴリ(子供、ティーンエージャー、若者、中年、老人、高齢者)が示された画像を収集しました。この画像セットには、有名人の生涯を通じてキャプチャされた画像が含まれており、キャプション付きの写真はモデルに画像と年齢の関係を説明します。その後、トレーニングされたモデルは、テキストプロンプトを介して目標の年齢を指定することによって、エージングまたはデエージングのシナリオをシミュレートするために使用できるようになりました。これらのテキストプロンプトは、画像生成プロセスでモデルをガイドします。 研究者たちは、事前にトレーニングされた潜在拡散モード、個人の身元特定情報を学習するための20枚の顔のトレーニング画像の小さなセット、および画像とそのキャプションの関連性を理解するための600組の画像キャプションの補助的なセットを使用しました。 彼らは適切な損失関数を使用してモデルを微調整しました。また、画像にランダムな変動やノイズを加えたり、取り除いたりしました。さらに、研究者は「DreamBooth」という技術を使用して、ニューラルネットワークコンポーネントの融合によって、人間の顔の画像を徐々に制御された変換プロセスで操作しました。 彼らは、他の年齢変更技術と比較してモデルの正確性を評価しました。この評価を行うために、26人のボランティアに対して生成された画像を同じ個人の実際の写真と関連付けるように依頼しました。さらに、顕著な顔認識アルゴリズムであるArcFaceを使用した比較も行いました。その結果、彼らの方法は優れたパフォーマンスを示し、他の技術のパフォーマンスを上回り、不正な拒否の頻度を最大で44%削減しました。 研究者たちは、トレーニングデータセットに中年のカテゴリの画像が含まれている場合、生成された画像はさまざまな年齢グループを効果的に表現することを発見しました。一方、トレーニングセットには主に高齢者の画像が含まれている場合、モデルは逆の極端な範囲(子供のカテゴリなど)に属する画像を生成しようとする際に課題に直面します。さらに、生成された画像は、トレーニング画像をより古い年齢グループに変換する能力を男性と比較して特に示しています。この不一致は、トレーニング画像にメイクが含まれていることに起因する可能性があります。逆に、人種や民族の変動は生成された出力には顕著で識別できる効果をもたらしませんでした。
生成AIにおけるプロンプトエンジニアリングの基本原則
導入 この記事では、生成型AIにおけるChatGPTプロンプトエンジニアリングについて説明します。ChatGPTは2022年11月以来、技術者や非技術者の間で最も話題となっているトピックの一つです。これは知的な会話の一形態であり、知的な会話の時代の幕開けを示しています。科学、芸術、商業、スポーツなど、ほぼ何でも尋ねることができ、それらの質問に答えを得ることができます。 この記事はデータサイエンスブログマラソンの一環として公開されました。 ChatGPT Chat Generative Pre-trained Transformer、通常はChatGPTとして知られているものは、ユーザープロンプトに基づいて新しいテキストを生成する役割を示すChat Generative Pre-trained Transformerの頭字語です。この会話フレームワークは、オリジナルのコンテンツを作成するために広範なデータセットでのトレーニングを行います。Sam AltmanのOpenAIは、ChatGPTによって示されるように、最も重要な言語モデルの一つを開発したとされています。この素晴らしいツールは、テキスト生成、翻訳、要約のタスクを容易に実行することができます。これはGPTの3番目のバージョンです。ChatGPTの使い方はほとんどの人が知っているため、インターフェースや操作方法などについては議論しません。しかし、LLMについては議論します。 プロンプトエンジニアリングとは何ですか? 生成型AIにおけるプロンプトエンジニアリングは、AI言語モデルの能力を活用する高度なツールです。これにより、モデルに明確で具体的な指示が与えられ、言語モデルのパフォーマンスが最適化されます。指示を与える例は以下の通りです。 モデルに明示的な指示を与えることは、回答を正確にするために有益です。例 – 99 * 555は何ですか?「回答が正確であることを確認してください」という指示は、「99 * 555は何ですか?」よりも良いです。 大規模言語モデル(LLM) LLMは、自己教師あり学習技術を用いて、大量のデータに対してニューラルネットワークの技術を適用して、人間らしいテキストを生成するAIベースのアルゴリズムです。OpenAIのChat GPTやGoogleのBERTなどがLLMの例です。LLMには2つのタイプがあります。…
「AIと倫理の架け橋:医療実施における包括的な解決策」
「この記事では、AIの倫理的な考慮事項について掘り下げ、医療の分野でAIの力を責任を持ってかつ公正に活用する方法について検討します」
AIはETLの再発明に時間を浪費する必要はない
「AIコミュニティはデータ統合を再発明しようとしていますが、現在のETLプラットフォームは既にこの問題を解決していますなぜ再発明すべきではないかを説明します」
「Azure Lightweight Generative AI Landing Zone」
「Azure AI サービスに基づくランディングゾーンの構築に関する完全ガイドでは、AI プロダクトを紹介し、AI の活用により利益を得るトップ 3 の企業について調査します」
Siameseネットワークの導入と実装
イントロダクション シャムネットワークは、たった1つの例に基づいて正確な画像分類を可能にする興味深いアプローチを提供します。これらのネットワークは、データセット内の画像のペアの類似性を測定するためにコントラスティブロスと呼ばれる概念を使用します。画像の内容を解読する従来の方法とは異なり、シャムネットワークは画像間の変動と類似点に集中しています。この独特な学習方法は、限られたデータのシナリオにおいても強さを発揮し、ドメイン固有の知識なしでも性能を向上させます。 この記事では、シャムネットワークのレンズを通して署名の検証の魅力的な領域に深く入り込みます。PyTorchを使用して機能的なモデルを作成する方法について、洞察と実装手順を提供します。 学習目標 シャムネットワークの概念と双子のサブネットワークを含むユニークなアーキテクチャの理解 シャムネットワークで使用されるロス関数(バイナリクロスエントロピー、コントラスティブロス、トリプレットロス)の違いを理解する シャムネットワークが効果的に使用できる実世界のアプリケーション(顔認識、指紋認識、テキストの類似性評価など)を特定し説明する シャムネットワークの1ショット学習、汎用性、ドメインに依存しないパフォーマンスに関する利点と欠点をまとめる この記事はデータサイエンスブログマラソンの一部として公開されました。 シャムネットワークとは何ですか? シャムネットワークは、ワンショット分類のために2つの同じ構造のサブネットワークを使用するネットワークのカテゴリに属しています。これらのサブネットワークは、異なる入力を受け入れながら、同じセットアップ、パラメータ、重みを共有します。シャムネットワークは、複数のクラスを予測するために豊富なデータで訓練される従来のCNNとは異なり、類似性関数を学習します。この関数により、少ないデータを使用してクラスを識別することができるため、ワンショット分類に非常に効果的です。このユニークな能力により、これらのネットワークは多くの場合、1つの例で正確に画像を分類することができます。 シャムネットワークの実世界の応用例として、顔認識や署名の検証のタスクがあります。例えば、会社が自動顔認識に基づいた出席システムを導入するとします。従来のCNNでは、各従業員の1枚の画像しか利用できないため、正確に何千人もの従業員を分類するのは困難です。そこでシャムネットワークが登場し、このようなシナリオで優れた性能を発揮します。 フューショットラーニングの探求 フューショットラーニングでは、モデルは限られた数の例に基づいて予測を行うためのトレーニングを行います。これは、従来のアプローチとは対照的で、トレーニングには大量のラベル付きデータが必要です。フューショットモデルのアーキテクチャは、わずかな数のサンプル間の微妙な違いを活用し、わずかな数やたった1つの例に基づいて予測を行うことができます。シャムネットワーク、メタラーニングなどのさまざまな設計フレームワークが、この機能を可能にします。これらのフレームワークは、モデルが意味のあるデータ表現を抽出し、それを新しい、未知のサンプルに使用することができるようにします。 フューショットラーニングが活躍する実用例には、以下のものがあります: 監視カメラにおける物体検出: フューショットラーニングは、物体の検出において、それらの物体の例がわずかしかない場合でも効果的に識別することができます。わずかなラベル付きの例を使ってモデルをトレーニングした後、それらの物体を新しい映像で検出することができます。 2. 個別のヘルスケア: 個別のヘルスケアでは、医療専門家は患者の医療記録の限られたセットを持っている場合があります。これにはCTスキャンや血液検査の少数の例が含まれます。フューショットラーニングモデルを使用すると、トレーニング用のわずかな例から、患者の将来の健康状態を予測することができます。これには、特定の疾患の発症の予測や特定の治療法への反応の予測などが含まれます。 シャムネットワークのアーキテクチャ Siameseネットワークの設計には、2つの同一のサブネットワークが含まれており、それぞれが入力の1つを処理します。最初に、入力は畳み込みニューラルネットワーク(CNN)を介して処理されます。このCNNは、提供された画像から有意な特徴を抽出します。その後、これらのサブネットワークはエンコードされた出力を生成し、通常は完全に接続された層を介して、入力データの縮約表現を生成します。 CNNは、2つのブランチと共有の特徴抽出コンポーネントで構成される、畳み込み、バッチ正規化、ReLU活性化、最大プーリング、およびドロップアウト層のレイヤーからなります。最後のセグメントでは、抽出された特徴を最終的な分類結果にマッピングするFC層が含まれています。関数は、線形層の後にReLU活性化のシーケンスと連続的な操作(畳み込み、バッチ正規化、ReLU活性化、最大プーリング、およびドロップアウト)の系列が続きます。フォワード関数は、入力をネットワークの両方のブランチに案内します。 差分層は、入力の類似性を特定し、異なるペア間の差を増幅するためにユークリッド距離関数を使用します:…
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.