Search Results ( link

「OWLv2のご紹介：ゼロショット物体検出におけるGoogleのブレークスルー」

はじめに 2023年も終わりが近づいていますが、コンピュータビジョンコミュニティにとっての興奮するニュースは、Googleが最近OWLv2のリリースとともにゼロショットオブジェクト検出の世界で大きな進歩を遂げたことです。この最新モデルは🤗 Transformersで利用可能であり、これまでに存在する中でも最も堅牢なゼロショットオブジェクト検出システムの1つを表しています。これは昨年に導入されたOWL-ViT v1の基盤を築いています。この記事では、このモデルの動作とアーキテクチャを紹介し、推論を実行する実用的なアプローチを見ていきます。さあ、始めましょう。学習目標コンピュータビジョンにおけるゼロショットオブジェクト検出の概念を理解する。 GoogleのOWLv2モデルの背後にある技術とセルフトレーニングのアプローチについて学ぶ。 OWLv2の使用に必要な実用的なアプローチ。この記事はデータサイエンスブログマラソンの一環として公開されました。 OWLv2の技術 OWLv2の印象的な機能は、その革新的なセルフトレーニングのアプローチによるものです。このモデルは、10億以上の例から成るウェブスケールデータセットでトレーニングされました。これを達成するために、著者たちはOWL-ViT v1の強力さを活用し、そのモデルを使用して擬似ラベルを生成し、それを使ってOWLv2をトレーニングしました。さらに、モデルは検出データ上で微調整され、それによって先行モデルであるOWL-ViT v1に比べて性能が向上しました。セルフトレーニングによってオープンワールドの位置特定のウェブスケールトレーニングが可能になり、オブジェクトの分類や言語モデリングで見られるトレンドに倣っています。 OWLv2のアーキテクチャ OWLv2のアーキテクチャはOWL-ViTと似ていますが、オブジェクト検出のヘッドに注目すべき追加があります。これにより、予測ボックスがオブジェクトを含む可能性を予測するオブジェクト性の分類器が含まれるようになりました。オブジェクト性スコアは洞察を提供し、テキストクエリに関係なく予測を順位付けやフィルタリングするために使用することができます。ゼロショットオブジェクト検出ゼロショット学習は、GenAIのトレンド以来一般的になった新しい用語です。これは、主に大規模言語モデル（LLM）の微調整で見られます。これは、いくつかのデータを使用してベースモデルを微調整し、モデルが新しいカテゴリに対応するようにすることを指します。ゼロショットオブジェクト検出はコンピュータビジョンの分野で画期的なものです。これは、手動で注釈付けされたバウンディングボックスの必要がなくなり、モデルが画像内のオブジェクトを検出する能力を向上させます。これによりプロセスがスピードアップし、手動の注釈が不要になるため、人間にとっては魅力的で、退屈ではありません。 OWLv2の使い方 OWLv2はOWL-ViTと同様のアプローチを採用していますが、更新されたイメージプロセッサOwlv2ImageProcessorを特徴としています。さらに、モデルはテキストのエンコードにCLIPTokenizerを使用しています。Owlv2ProcessorはOwlv2ImageProcessorとCLIPTokenizerを組み合わせた便利なツールであり、テキストのエンコードプロセスを簡素化します。以下に、Owlv2ProcessorとOwlv2ForObjectDetectionを使用してオブジェクト検出を実行する方法の例を示します。…

「ドラッグ＆ドロップ、分析：ノーコードデータサイエンスの台頭」

データサイエンスにおけるノーコードまたはローコードの機能は、近年大きな注目を集めていますこれらのソリューションは十分に実証され、成熟しており、データサイエンスをより幅広い人々にアクセス可能にしています

Data science

「データプラットフォームから機械学習プラットフォームへ」

データ/機械学習は、私たちのテクノロジーの風景では最も人気のあるトピックです私はデータ/機械学習プラットフォームの理解と、それらのプラットフォームが基本的なものから複雑なものへと進化する方法を共有したいと思います最後に、最善を尽くします...

データの宇宙をマスターする：繁栄するデータサイエンスのキャリアへの鍵となる手順

この記事では、スキルの学習から仕事の入手まで、データサイエンスのキャリアの主要な6つの柱をカバーしています

Career Advice

「LlamaIndex：カスタムデータで簡単にLLMアプリケーションを強化する」

「LlamaIndex」という革新的なツールを使用して、プライベートデータと大規模言語モデル（LLM）の統合を探求しましょうこの包括的なガイドでは、インストール方法、ユースケース、およびLlamaIndexとLangchainの選択について学びましょう

「ダイナミックプライシングを活用して収益を最適化する方法は？」

導入 Uber/Olaのピーク時の料金は通常の運賃よりも高くなります。IRCTCでは、予約率が上がるとRajdhaniの料金も上昇し、Amazonでは同じ商品の価格が何度も変化します。これらの価格をいつ変更するか、どの程度変更するかを決定するのは誰でしょうか？いつ正しい時に正しい価格を決定するのでしょうか？これらの質問の答えは、ダイナミックプライシングの範囲に含まれます。この記事では、初心者が基本的なダイナミックプライシングアルゴリズムを構築するためのリソースと理論的な理解を提供します。学習目標価格設定の基礎と異なる価格設定の方法を理解するダイナミックプライシング、利点・欠点、方法、ユースケースなどについて深く掘り下げる収益管理の基礎収益最大化のためのPythonを使用したシンプルなダイナミックプライシングアルゴリズムの実装この記事はデータサイエンスブロガソンの一環として公開されました。「価格」とは何ですか？ 2023年8月、玉ねぎの価格は1キログラムあたり120ルピーでした。その要因は何でしょうか？外部の環境要因による供給の逼迫と安定した需要です。市場、買い手、売り手、需要、供給が価格を決定します。映画のチケット、バスのチケット、EC、燃料など、私たちが今日購入するほとんどの製品も同様です。価格の理論では、需要と供給が商品やサービスの取引価格を決定します。消費者の支払いが生産の限界費用と一致する場合、最適な市場価格、つまり需要と供給の均衡点とも呼ばれる点を達成します。適切な価格を適切な時に設定することは、ビジネスの成長にとって不可欠です。価格担当者は、データと分析を通じて「適切な価格」に近づくことに焦点を当てます。価格に影響を与える要素組織的な要素: 商品の在庫、予算制約。マーケティングミックス: 製品のライフサイクルのステージ、製品、価格、場所、販促。製品コスト: 生産コストと原材料のコスト。製品への需要: 製品やサービスへの需要。市場の競争: 競合他社の価格が内部価格を大きく決定します。ダイナミックプライシングとは何ですか？ダイナミックプライシングでは、最近のトレンド、リアルタイムの顧客の行動、供給と需要、競合他社の価格などを利用して販売される商品の価格を評価します。これにより、顧客の満足度が満たされ、事業が成長できるように、異なる価格ポイントで商品が販売されることが可能になります。…

「機械学習をマスターするための5つの無料の本」

機械学習は、現在コンピュータ科学の中でも最もエキサイティングな分野の一つですこの記事では、2023年に機械学習を学ぶための最高かつ無料の５冊の書籍を紹介します

Machine learning

説明可能なAI：ブラックボックスモデルの解明

イントロダクション現代のデータ駆動型の世界では、機械学習はさまざまな産業でますます重要な役割を果たしています。説明可能なAI（XAI）は、クライアント、患者、または融資申請者に機械学習モデルをより透明にすることを目指し、これらのシステムへの信頼と社会的受容を構築することを目指しています。今、異なるモデルには、観客によって異なる説明方法が必要となります。この記事では、説明可能なAI（XAI）の重要性と応用、およびブラックボックスモデルの解明方法について議論します。学習目標: 機械学習における透明性と信頼性を向上させるための説明可能なAI（XAI）の重要性と応用を理解する。 XAIにおけるグローバルとローカルのアプローチの違いを認識し、それぞれの使用例を理解する。 LIME、SHapley Additive Explanations、および対事実的な説明など、モデルの透明性と互換性のための重要なXAIの手法を探索する。説明可能なAIとは何ですか？意思決定における機械学習の使用は、すべての産業、企業、組織の重要な部分となっています。これらの決定は、事業主、マネージャー、エンドユーザー、ドメインエキスパート、規制当局、データサイエンティストなど、様々な利害関係者に影響を与えます。したがって、これらのモデルがどのように意思決定を行っているかを理解することは非常に重要です。規制当局は、特に意思決定に重大な影響を与える高度に規制されたセクターでの機械学習に関心を持ち始めています。特に金融、医療、犯罪、保険などの分野では、特定の決定がなぜ行われたのか、およびなぜ行われたのかを知ることが重要です。説明可能なAIは、これらのすべての利害関係者が機械学習モデルをより透明にすることを目指しています。また、データサイエンティストにもモデルをより良く理解する手助けをします。ただし、XAIが常に必要なわけではなく、賢明に使用する必要があります。一部のシナリオでは、複雑すぎる説明は不信感や混乱を引き起こす可能性があります。説明可能性の種類説明可能なAIにはさまざまな方法があり、それぞれ異なる使用例と利害関係者に配慮しています。ビジネスオーナー、マネージャー、ユーザー、ドメインエキスパート、規制当局、データサイエンティストに対して、AIモデルを説明するために異なる手法が必要です。利害関係者のニーズに応じて、異なる説明方法が必要とされることがあります。規制当局がAI分野で要件や規制を提案するようになり、金融、医療、刑事司法などの厳しく規制された産業では説明可能性がより重要になっています。これらの分野の機械学習モデルは、クライアント、患者、または融資申請者に対して透明性を提供できる必要があります。説明可能なAIには、次のようなさまざまな種類の手法と技術が含まれます：アドホック/内在的な手法：これらの手法は学習前にモデルの複雑さを制限します。特定のアルゴリズムを選択し、特徴の数を制限することを含みます。ポストホック手法：これらの手法はモデルの訓練後に適用されます。ブラックボックスモデルの説明においては、より柔軟性があります。モデル固有 vs モデル非依存：一部の手法は特定のタイプのブラックボックスモデルに特化しており、他の手法は一般的に適用できます。ローカル vs グローバル手法：ローカル手法は個々のインスタンスやデータポイントの説明を提供し、グローバル手法はデータセット全体のモデルの振る舞いについての洞察を提供します。説明可能なAIの重要性…

「創発的AIの倫理的なフロンティア：導入と重要性」

イントロダクション生成AIは、コンテンツの創造、模倣、強化という顕著な能力を持つことから、無類の可能性と複雑な倫理的ジレンマが両立する時代をもたらしました。本記事では、生成AIの倫理的フロンティアに深く掘り下げ、急速に変化するデジタルランドスケープにおけるその重要性を強調します。この記事は、人間の自律性の脅威や現実のゆがみから機会の不平等や文化的表現まで、生成AIに関連する多面的な課題を明らかにしようとします。これらの課題に取り組むことで、我々はこの変革的な技術を責任を持って航行し、社会の利益を確保しつつ、重要な価値観と権利を守ることができます。本記事では、開発者や組織が倫理的な原則を維持するために採用できる戦略と解決策についての示唆を提供しています。学習目標: 人間の自律性や現実のゆがみなど、生成AIにおける倫理的課題を理解する。人間の自律性、真実、多様性をAI開発において守るための戦略を探究する。データセキュリティ、プライバシー、およびAI関連の機会の不平等に取り組む重要性を認識する。自律性：人間の意思決定に対する課題 AI開発に関連する重要なリスクの一つは、人間の自律性に損害を与える可能性です。例えば、最近の事例では、ある組織がAIを使用して年齢や性別に基づいて雇用の決定を違法に差別しました。この例は、倫理的な考慮をせずにAIに意思決定を委任する危険性を示しています。最初のリスクは、AIへの過度な依存にあります。協力ツールとしてではなく、意思決定にAIを頼ることは、批判的思考能力の低下につながる可能性があります。AIツールがより効率的になるにつれて、人々は盲目的にそれらを信頼し、独立した判断力を損なう可能性があります。二つ目のリスクは、偏見の持続です。AIシステムが人間の介入なしで意思決定を行う場合、意図的であれ非意図的であれ、偏見が持続する可能性があり、人間の自律性がさらに侵食される恐れがあります。三つ目のリスクは、全知全能の幻想に関わります。人々がAIツールを透明な意思決定プロセスを理解せずにますます信頼するようになると、これらのツールは神秘的な全知全能の存在となるかもしれません。これは、自己の判断力よりもAIを信頼する世代を生み出す、懸念すべき展望です。 AI開発における人間の自律性の保護人間の自律性を守るために、AI開発中に取り組むべき手順があります: 人間をループに含める: 人間の関与は、AIが欠如する倫理的価値観、道徳、文脈の認識をもたらします。人間とAIの協力を促進することで、より良い、多様かつ正確な結果が得られます。ユーザーを強化する: AIユーザーを意思決定プロセスの積極的な参加者にする。AIとのインタラクションで文脈と明確化を提供するよう促す。透明な意思決定: 透明で追跡可能かつ監査可能なAIモデルを開発する。ユーザーはAIの結論がどのように導かれたのかを理解することができるべきです。積極的なモニタリング: 定期的にAIシステムを監査しテストすることで、倫理的および法的基準との一致を確認します。これにより、AIが人間の自律性を損なうのではなく、人間に利益をもたらし続けるようにします。 AIにおける真実と現実の保護のための戦略と解決策生成AIの第二の倫理的フロンティアは、現実をゆがめ真実を損なう可能性です。ディープフェイクの出現は、AIツールが欺瞞や操作のために悪用される例です。この現実のゆがみに関連するリスクには、情報の拡散、メンタルヘルスへの影響、文化的価値の喪失、少数派の意見の抑圧が含まれます。最終的に、これらのリスクは社会の不安定につながる可能性があります。…

「Hugging Face の推論エンドポイントを使用して埋め込みモデルを展開する」

Generative AIやChatGPTのようなLLMsの台頭により、様々なタスクの組み込みモデルへの関心と重要性が高まっています。特に検索や自分のデータとのチャットなどのリトリーバル・オーグメント生成のために、埋め込みモデルは役立ちます。埋め込みは、文、画像、単語などを数値ベクトル表現として表現するため、意味的に関連するアイテムをマッピングし、役立つ情報を取得することができます。これにより、質と特定性を向上させるための関連コンテキストをプロンプトに提供することができます。 LLMsと比較して、埋め込みモデルはサイズが小さく、推論が早いです。このため、モデルを変更したり、モデルの微調整を改善した後に埋め込みを再作成する必要があるため、非常に重要です。また、リトリーバルのオーグメントプロセス全体ができるだけ高速であることも重要です。これにより、良いユーザーエクスペリエンスを提供することができます。このブログ記事では、オープンソースの埋め込みモデルをHugging Face Inference Endpointsに展開する方法と、モデルを展開するのを簡単にするマネージドSaaSソリューションであるText Embedding Inferenceの使用方法を紹介します。さらに、大規模なバッチリクエストの実行方法も説明します。 Hugging Face Inference Endpointsとは何か Text Embedding Inferenceとは何か埋め込みモデルをインファレンスエンドポイントとして展開する方法エンドポイントにリクエストを送信し、埋め込みを作成する方法始める前に、インファレンスエンドポイントについての知識をリフレッシュしましょう。 1. Hugging Face Inference Endpointsとは何ですか？…

Learn more about Search Results ( link - Page 33