Learn more about Search Results link - Page 64

「ソースフリーなドメイン適応の汎用的な方法を探求する」

Google の研究科学者であるエレニ・トリアンタフィルーと学生研究員であるマリック・ブディアフによって投稿されました。 ディープラーニングは、最近多くの問題とアプリケーションで著しい進歩を遂げていますが、モデルは未知のドメインや分布で展開された場合に予測不能に失敗することがよくあります。ソースフリーなドメイン適応(SFDA)は、事前にトレーニングされたモデル(「ソースドメイン」でトレーニングされたもの)を新しい「ターゲットドメイン」に適応させるための方法を、後者の非ラベルデータのみを使用して設計するための研究分野です。 ディープモデルに対する適応方法の設計は、重要な研究分野です。モデルとトレーニングデータセットの規模の増加が彼らの成功の鍵要素である一方で、この傾向の否定的な結果は、このようなモデルのトレーニングがますます計算コストがかかるということであり、一部の場合では大規模なモデルのトレーニングがアクセスしにくくなり、不必要に炭素フットプリントを増加させることになります。この問題を緩和する方法の一つは、既にトレーニングされたモデルを活用して新しいタスクに対処したり、新しいドメインに一般化するための技術を設計することです。実際、モデルを新しいタスクに適応することは、転移学習の枠組みの下で広く研究されています。 SFDAは、適応が望まれるいくつかの実世界のアプリケーションにおいて、ターゲットドメインからのラベル付きの例が利用できないという問題に直面しています。実際、SFDAは増加している注目を集めています[1, 2, 3, 4]。しかし、野心的な目標に基づいているものの、ほとんどのSFDAの研究は非常に狭い枠組みに基づいており、画像分類タスクでの単純な分布シフトのみを考慮しています。 この傾向から大きく逸脱し、私たちはバイオアコースティクスの分野に注目し、自然発生的な分布シフトが広く存在し、しばしばターゲットドメインのラベル付きデータが不十分で、実践者にとって障害となっていることに着目します。このアプリケーションにおけるSFDAの研究は、既存の方法の一般化可能性を学術界に知らせ、オープンな研究方向を特定するだけでなく、フィールドの実践者に直接的な利益をもたらし、私たちの世紀の最大の課題の一つである生物多様性保全に寄与することができます。 この投稿では、「ソースフリーなドメイン適応の汎用的な手法を探る」と題したICML 2023で発表される論文を紹介します。私たちは、バイオアコースティクスにおける現実的な分布シフトに直面した場合、最先端のSFDAの手法が性能を発揮しない場合や崩壊する場合があることを示します。さらに、既存の手法は、ビジョンベンチマークで観察されるのとは異なる相対的なパフォーマンスを発揮し、驚くべきことに、時には適応なしよりも悪い結果を示す場合もあります。また、私たちはNOTELAという新しいシンプルな手法を提案し、これらのシフトで既存の手法を凌駕しながら、さまざまなビジョンデータセットで強力なパフォーマンスを発揮することを示します。全体として、私たちは、一般に使用されるデータセットと分布シフトのみでSFDAの手法を評価すると、相対的なパフォーマンスと汎化性能について狭視野な視点になると結論付けます。彼らの約束を果たすためには、SFDAの手法はより広範な分布シフトでテストされる必要があり、高い影響を持つアプリケーションに利益をもたらす自然発生的なシフトを考慮することを提唱します。 バイオアコースティクスにおける分布シフト バイオアコースティクスでは、自然発生的な分布シフトが広く存在します。鳥の鳴き声のための最大のラベル付きデータセットはXeno-Canto(XC)であり、世界中の野生鳥のユーザー投稿の録音のコレクションです。XCの録音は「焦点化」されており、自然環境で捕獲された個体を対象としており、識別された鳥の鳴き声が前景にあります。しかし、連続的なモニタリングや追跡の目的では、実践者はしばしば全周マイクを介して得られる「サウンドスケープ」における鳥の識別に関心を持っています。これは非常に困難であることを最近の研究が示しているよく文書化された問題です。この現実的なアプリケーションに着想を得て、私たちはバイオアコースティクスでSFDAを研究し、ソースモデルとしてXCで事前にトレーニングされた鳥種分類器を使用し、さまざまな地理的位置からの「サウンドスケープ」(シエラネバダ(S.ネバダ)、パウダーミル・ネイチャーリザーブ(ペンシルベニア州、米国)、ハワイ、カプレス・ウォーターシェッド(カリフォルニア州、米国)、サプサッカー・ウッズ(ニューヨーク州、米国)、コロンビア)をターゲットドメインとして使用します。 この焦点化から受動化への変化は大きいです。後者の録音では、しばしば信号対雑音比が低く、複数の鳥が同時に鳴いており、雨や風などの多くの鳥や環境の雑音もあります。さらに、異なるサウンドスケープは異なる地理的位置から発生しており、XCの種の非常に小さな部分しか表示されないため、非常に極端なラベルのシフトを引き起こします。さらに、現実のデータでは、ソースドメインとターゲットドメインの両方が顕著なクラスの不均衡を持っているため、いくつかの種は他の種よりも著しく一般的です。さらに、SFDAが通常研究される標準的な単一ラベルの画像分類シナリオとは異なり、各録音内で複数の鳥が識別される可能性があるため、私たちはマルチラベル分類問題も考慮しています。 「フォーカス→サウンドスケープ」のシフトのイラストです。フォーカスされた領域では、録音は通常、シグナル対雑音比(SNR)が高い、単一の鳥の鳴き声が前景に捉えられていますが、背景には他の鳥の鳴き声がある場合もあります。一方、サウンドスケープには全方位マイクロフォンからの録音が含まれ、同時に複数の鳥が鳴き、昆虫や雨、車、飛行機などの環境音も含まれることがあります。 オーディオファイル                 フォーカス領域                  サウンドスケープ領域1       スペクトログラム画像                  フォーカス領域(左)からサウンドスケープ領域(右)への分布の変化を、各データセットからの代表的な録音のオーディオファイル(上)とスペクトログラム画像(下)で示したものです。2つ目のオーディオクリップでは、鳥の鳴き声が非常にかすかです。これは、サウンドスケープ録音では鳥の鳴き声が「前景」にないことが一般的な特徴です。クレジット:左:Sue…

「AIツールにより、アジア系のMIT学生のプロフェッショナルなヘッドショットが白人に変わる」

「これは間違いなく問題だと思います」と王ロナさんは述べ、「ソフトウェアを作る人々がこのようなバイアスに気付き、それらを軽減するための解決策を開発することを望んでいます」と述べました

「Meetupsからメンタリングまで データサイエンティストとしてのネットワーキングの方法」

ネットワーキング私たちは常に「ネットワーキングは有用だと聞いたことがあるけど、試してみてはどうですか?」などと言われますこのような励ましは善意であるものの、あまり役に立ちませんほとんどの人は理解しています...

データサイエンスのためのSQL:ジョインの理解と活用

SQLで異なる結合方法を使用する方法と、これがデータサイエンスにどのように役立つかを学びましょう

「10 Best AI医療書記」

「技術革新は医療部門に深い影響を与えており、AIを搭載した医療秘書が患者記録管理を革新していますこれらのツールは、医師のメモ取りの負担を軽減するだけでなく、効率的な文書化を通じて患者ケアを向上させますこのブログでは、今日の医療部門で波を起こしているトップ5のAI医療秘書について詳しく見ていきます1. […]」

「マッキンゼー・レポートからの5つの重要な洞察:創発的AIの未来への影響」

人工知能(AI)の変革力は既に仕事の風景を変え始めており、McKinseyのレポート「2023年のAIの状況:創造的AIのブレイクアウトイヤー」によれば、このトレンドは加速すると予想されています。このレポートは、労働市場の潜在的な変化に関する重要な洞察を強調し、労働者や産業の適応性と準備が求められることを強調しています。この記事では、レポートから得られた5つの重要な洞察について掘り下げ、労働力における創造的AIの影響について明らかにします。 1. 迫り来る雇用の転換: McKinseyのレポートによれば、2030年までに、創造的AIの進展により、アメリカでは約1200万人が新たな職業に転換する必要があると予測されています。創造的AI技術による自動化は、さまざまな産業で日常的で繰り返しの多いタスクを置き換えることが予想されています。これにより生産性と効率が向上する一方で、労働力は適応能力と再教育の必要性に直面することになります。 出典: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2023-generative-ais-breakout-year?cid=aisurge2023-soc–mar-mar–07/23-i1a–bam-ip&linkId=227872978#/ 2. 変化する雇用パターン: このレポートでは、アメリカにおける最近の雇用変動における重要なトレンドが強調されています。観察された860万人の雇用移行のうち、半数以上が飲食業、顧客サービス、事務支援、生産などの職種から離れていったことが明らかになりました。これらの職種は、繰り返し予測可能なタスクが多く、AIシステムによって効率的に実行される可能性があるため、自動化の影響を特に受けやすいです。労働力のこれらの変化への対応が、雇用市場の変革のペースを決定するでしょう。 出典: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2023-generative-ais-breakout-year?cid=aisurge2023-soc–mar-mar–07/23-i1a–bam-ip&linkId=227872978#/ 3. 創造的AIによる仕事の自動化の可能性: 創造的AIの能力は、雇用市場に大きな影響を与える可能性があります。レポートによれば、2030年までに、この技術によって最大30%の仕事が自動化されると予想されています。この自動化は、製造業、金融業、顧客サービスなど、さまざまなセクターに影響を与える可能性があります。ただし、自動化は必ずしも仕事の廃止を意味するわけではありません。代わりに、仕事の役割の変革や新しい機会の創出を意味することもあります。 出典: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2023-generative-ais-breakout-year?cid=aisurge2023-soc–mar-mar–07/23-i1a–bam-ip&linkId=227872978#/ 4. 生成AIの影響の二重性: 生成AIは、科学、技術、エンジニアリング、数学(STEM)、医療、建設などの専門分野で多くの仕事を自動化することができますが、これらの産業においても成長の機会を提供しています。例えば、生成AIは医療専門家が診断や治療計画を支援し、患者ケアを向上させることができます。建設では、AIが建物の設計を最適化し、プロジェクト管理を効率化することができます。 出典:https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2023-generative-ais-breakout-year?cid=aisurge2023-soc–mar-mar–07/23-i1a–bam-ip&linkId=227872978#/ 5. 雇用トレンドの対照: McKinseyの報告書は、産業間で異なる成長の軌道を強調しています。医療、STEM、建設セクターは、技術の進歩と高齢化人口による医療サービスの需要の増加により、雇用の成長を経験しています。しかし、報告書はまた、事務支援や顧客サービスの仕事が自動化とデジタル化により減少していることも明らかにしています。 出典:https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2023-generative-ais-breakout-year?cid=aisurge2023-soc–mar-mar–07/23-i1a–bam-ip&linkId=227872978#/…

「ゼロから効果的なデータ品質戦略を構築するためのステップバイステップガイド」

データエンジニアとして、私たちは(またはすべきです)提供するデータの品質に責任を持っていますこれは新しいことではありませんが、データプロジェクトに参加するたびに、私は常に同じ質問を自問自答します:完璧は…

「マスタリングモンテカルロ:より良い機械学習モデルをシミュレーションする方法」

モンテカルロ:統計的シミュレーションが機械学習を支える方法、πの推定からハイパーパラメータの最適化までPythonでこの多目的なテクニックを使用するためのガイド

ユーザーフィードバック – MLモニタリングスタックの欠けている部分

「AIモデルを数ヶ月もかけて実装し、何百万円も投資してみたけれど、誰も使ってくれないことって経験ありますか?採用の課題を乗り越えたとしても、モデルの出力がどの程度正確なのか、どうやって判断すればいいのか…」

自動化された欺瞞検出:東京大学の研究者が機械学習を通じて表情と脈拍を利用して欺瞞を暴く

デジタル時代において、自動化された欺瞞検知システムは、様々な分野で重要な存在となっています。正確な検知の需要は、商業、医学、教育、法執行機関、国家安全保障において明らかです。人間の面接官の制約により、誤った告発や効果のない検知のリスクが生じます。これらの課題に対処するため、東京理科大学の研究者たちは、包括的な欺瞞検知のために、表情と脈拍データを組み合わせた機械学習アプローチを提案しています。目標は、犯罪被害者、容疑者、精神的な問題を抱える人々との面接で役立つ公平で信頼性のあるシステムを開発することです。研究者たちは、正確な容疑者の分類の重要性を強調し、誤認識を避け、倫理的および法的な考慮事項を維持するために、ヒューマン・イン・ザ・ループのアプローチを提案しています。この革新的な方法は、倫理的な遵守を確保しながら、重要な意思決定プロセスに広範な応用を可能にします。 関連研究では、以前の研究でさまざまな方法を使用して欺瞞検知が探求されてきました。ある研究では、「欺瞞分析および推論エンジン」を開発し、動画からのマルチモーダル情報を用いて、AUCが約87%の精度で欺瞞を検知しました。別の研究では、真実と欺瞞の話者間のバレンスと興奮の違いを特定することに焦点を当て、感情的、視覚的、聴覚的、口頭的な特徴を用いて、AUCが91%を達成しました。AUCは、欺瞞検知などの二値分類タスクでよく使用される指標です。さらに、非言語行動(NVB)に基づいた欺瞞検知に機械学習アプローチが使用され、顔の微小運動、視線の変化、まばたきの頻度のような手がかりを特定することで、約80%の精度が達成されました。ただし、これらの研究の一部では、データ収集のための非自然な役割演技アプローチによる制約が観察されました。 従来の方法とは異なり、この革新的な研究では、被験者が自由に欺瞞的な行動を即興で行うことで、欺瞞検知の精度を向上させる自然なアプローチが導入されています。提案された方法では、機械学習、具体的にはランダムフォレスト(RF)技術を用いて、表情と脈拍データを統合した欺瞞検知モデルを作成します。データは、ランダムな画像について議論しながら欺瞞的な発言をする4人の男性大学院生から収集されました。表情はWebカメラを使用して記録され、面接中にはスマートウォッチを使用して脈拍が計測されました。 このプロセスには、データ収集、ラベリング、特徴抽出、前処理、分類などの標準的な機械学習のステップが含まれます。被験者にはさまざまな画像が示され、欺瞞的な発言を含めて自分の思考を表現するよう促されました。その結果得られたデータセットは、被験者の意図に基づいてラベル付けされ、誤りや虚偽の記憶ではなく、意図的な欺瞞に焦点を当てています。記録されたビデオからの顔のランドマークはOpenFaceライブラリを使用して抽出され、眉の傾斜、目のアスペクト比、口のエリア、まばたきの頻度、視線、頭の傾き、脈拍など、さまざまな顔の特徴がこれらのランドマークから導かれました。前処理には、欠損値の削除、外れ値のフィルタリング、ポジティブケースとネガティブケースのバランスを取るためのアンダーサンプリングが含まれました。 https://link.springer.com/article/10.1007/s10015-023-00869-9 ランダムフォレスト(RF)は、10分割交差検証を使用してトレーニングおよび評価され、精度、適合率、再現率、F1スコアなどのパフォーマンスメトリクスを使用してその効果を評価しました。実際の遠隔面接で実施された実験は、交差検証結果と類似のパフォーマンスを示し、この方法の現実世界での適用可能性を確認しました。特徴の重要度の分析では、特定の顔の特徴、脈拍、視線と頭の動きが異なる被験者間での欺瞞の重要な指標として浮き彫りにされました。例えば、口のエリアの変化、沈黙、まばたきは一部の場合に欺瞞的な行動を示し、他の場合では脈拍や視線の方向に顕著な変動が見られました。 全体として、この研究は、機械学習と顔の特徴解析を用いた遠隔面接における欺瞞的な発言の検知に対する実用的かつ有望なアプローチを提供し、現実世界での応用に貴重な示唆を提供しています。人間の偏見を排除した提案手法は、異なる被験者に対して0.75から0.88までの精度とF1スコアを示しました。顔の表情と脈拍に関連する共通の特徴が被験者間で観察されました。ただし、より包括的な分析のためには、多クラス分類の処理や心理的評価を含めたさらなる研究が必要です。データセットのサイズには制約があるものの、この研究は、倫理的な考慮事項と法的な遵守を重視しながら、自動化された欺瞞検知システムを利用する面接官にとって基盤となるものです。

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us