Learn more about Search Results 子供 - Page 15
- You may be interested
- 「スタンフォード大学の研究者が自然な視...
- 効果的にMLソリューションを比較する方法
- 「Mozilla Common Voiceにおける音声言語...
- PanelでインタラクティブなMLダッシュボー...
- 「Rosalynがオンライン試験の不正行為に立...
- がん診断の革命:ディープラーニングが正...
- AIの生成体験を向上させる Amazon SageMak...
- LMSYS ORG プレゼント チャットボット・ア...
- ディープラーニングシステムは、外部から...
- 「AIがセキュリティカメラの機能を強化し...
- 「AIの求人市場の黙示録を避けろ:生き残...
- 「物理データを使用してコンピュータビジ...
- より良いOCRパフォーマンスを得るためのEa...
- 「オンラインプログラムの中で第3位のデー...
- 「バリー・ディラー対生成AI:著作権法的...
「機械学習分類問題のさまざまな性能評価指標を知る」
「機械学習の文脈において、パフォーマンスメジャーは、訓練済みモデルの優れた性能を教えてくれる測定ツールと考えることができます通常、「正確さ」が標準的なメジャーとされています…」
「9歳の子に機械学習を説明するとしたら、どうやって説明しますか?」
子供たちのために簡単に説明された機械学習とデータサイエンスの世界を探索してくださいわかりやすいガイドで教わりながら、教師あり学習と教師なし学習に深く入り込みましょう
AIアートのマスタリング:中間の旅とプロンプトエンジニアリングへの簡潔なガイド
Midjourneyのマスタリングに最適な初心者向けガイドに飛び込んでみてくださいAI画像生成、高度なプロンプト、革新的な機能を簡単で分かりやすいステップで探索してくださいAI芸術の力を活用したい愛好家やプロフェッショナルに最適です
「深層学習を用いた深層オブジェクト:ZoeDepthはマルチドメインの深度推定のためのAIモデルです」
画像に子供が大人よりも高くて大きく見える錯覚に出くわしたことはありますか?エームスの部屋の錯視は、台形の形状をした部屋で、部屋の一角が他の角よりも視聴者に近いという有名なものです。特定のポイントから見ると、部屋の中のオブジェクトは正常に見えますが、別の位置に移動すると、サイズと形状が変わり、自分の近くに何があるのか、何がないのかがわかりにくくなります。 ただし、これは私たち人間にとっての問題です。通常、私たちはシーンを見るとき、錯覚のトリックがなければ、オブジェクトの奥行きをかなり正確に推定します。一方、コンピュータは視覚処理の基本的な問題である奥行き推定においてはあまり成功していません。 奥行き推定は、カメラとシーン内のオブジェクトとの距離を決定するプロセスです。奥行き推定アルゴリズムは、画像または画像の連続を入力として受け取り、シーンの対応する奥行きマップまたは3D表現を出力します。これは、ロボット工学、自律型車両、仮想現実、拡張現実など、さまざまなアプリケーションでシーンの奥行きを理解するために重要なタスクです。たとえば、安全な自動運転車を持ちたい場合、前方の車までの距離を理解して運転速度を調整することが重要です。 奥行き推定アルゴリズムには、メトリック奥行き推定(MDE)と、シーン内のオブジェクトの相対距離を推定する相対奥行き推定(RDE)の2つの分野があります。 MDEモデルは、マッピング、計画、ナビゲーション、オブジェクト認識、3D再構築、画像編集に役立ちます。ただし、MDEモデルのパフォーマンスは、特に画像の奥行きスケールに大きな差がある場合(たとえば、室内と屋外の画像など)に、複数のデータセットをまたがって単一のモデルをトレーニングする場合に低下することがあります。その結果、現在のMDEモデルは、特定のデータセットにオーバーフィットし、他のデータセットに対してうまく汎化しません。 一方、RDEモデルは、視差を監督手段として使用します。RDEの深さ予測は、画像フレーム間で互いに一貫しているだけで、スケールファクターは不明です。これにより、RDEメソッドは、3D映画を含むさまざまなシーンとデータセットでトレーニングすることができ、モデルの汎用性を向上させるのに役立ちます。ただし、トレードオフとして、RDEで予測される深さにはメトリックな意味がないため、その応用範囲が制限されます。 これらの2つのアプローチを組み合わせたらどうなるでしょうか?私たちは、さまざまなドメインにうまく汎化できる同時に正確なメトリックスケールを保持する奥行き推定モデルを持つことができます。これがZoeDepthが達成したことです。 ZoeDepthの概要。出典:https://arxiv.org/pdf/2302.12288.pdf ZoeDepthは、MDEとRDEのアプローチを組み合わせた2ステージのフレームワークです。第1ステージは、相対的な深さを推定するためにトレーニングされたエンコーダーデコーダー構造で構成されています。このモデルはさまざまなデータセットでトレーニングされており、汎化性能が向上しています。第2ステージでは、メトリックな深さを推定するためのコンポーネントが追加されます。 このアプローチで使用されるメトリックヘッドのデザインは、単一の深さ値ではなく、各ピクセルに対して一連の深さ値を推定するメトリックビンズモジュールと呼ばれる手法に基づいています。これにより、モデルは各ピクセルに対して可能な深さ値の範囲を捉えることができ、その精度と頑健性を向上させることができます。これにより、シーン内のオブジェクト間の物理的な距離を考慮した正確な深度測定が可能になります。これらのヘッドはメトリックな深度データセットでトレーニングされ、第1ステージと比べて軽量です。 推論においては、分類モデルがエンコーダーの特徴を使用して各画像に適切なヘッドを選択します。これにより、モデルは特定のドメインやシーンのタイプに対して深度推定に特化することができ、相対的な深度の事前トレーニングからも恩恵を受けることができます。最終的に、複数の構成で使用できる柔軟なモデルが得られます。
「ESRBは、顔認識技術を使って人々の年齢を確認することを始めることを望んでいます」
FTCは現在、ESRBの提案について一般からのフィードバックを求めています
生成AI倫理’ (Seisei AI Rinri)
生成型人工知能(AI)に関する大騒ぎがある中で、この変革的な技術を責任を持って実装する方法について、未解決の問題が増えていますこの…
「シェアレンティングの危険性:オンラインで成長する暗い側面」
レナード・コーエンのこの言葉を振り返ると、今日においてもその不気味な関連性に驚かされずにはいられません多くの子供たちがソーシャルメディアのために自殺をしていますそして、この脅威は...
PaLM AI | Googleの自家製生成AI
イントロダクション OpenAIによるGPT(Generative Pre-trained Transformers)モデル、特にChatGPTなどのような生成型AIモデルの登場以来、Googleは常にそれと同様のAIモデルを作成し、ローンチすることに取り組んできました。GoogleはBERTモデルを通じてTransformerについて最初に世界に紹介しましたが、Attention is All You Need論文を通じて、OpenAIが開発したものと同じくらい強力で効率的な大規模言語モデルを作成することはできませんでした。Googleが最初に紹介したBard AIはあまり注目されませんでした。最近、GoogleはBard AIの背後にあるPaLM(Pathways Language Model)へのAPIアクセスをリリースしました。このガイドでは、PaLM APIの使い方について説明します。 学習目標 Pathways Language Modelの使い方を学ぶ PaLMが提供する主な機能を理解する PaLM 2を使用してアプリケーションを作成する 大規模言語モデルのクイックプロトタイピングのためのMakerSuiteを活用する PaLM APIの使い方を理解する この記事はData…
「日常的な言葉で説明された最も一般的な機械学習用語10選」
「料理のレシピを最初に試した時、覚えていますか?おそらくそれはチョコレートチップクッキーや辛いサルサのレシピだったかもしれません指示をスキャンすると、『折りたたむ』などの用語にぶつかりました…」
「人間の知能の解読:スタンフォードの最新のAI研究は、生来の数の感覚は学びのスキルなのか、自然の贈り物なのかを問いかける」
任意の数量を解読する能力は、数の感覚と呼ばれます。数の感覚は数学的認識において重要です。大量のものを小さなグループに整理したり、数値の量を数えるなど、さまざまな活動が私たちの神経系によって容易に行われますが、これらの数の感覚の出現は不明です。数の表現が人間の脳でどのように出現するのか、よりよく理解する必要があります。 スタンフォード大学の人間中心の人工知能(HAI)研究者は、生物学的にインスピレーションを受けたニューラルアーキテクチャを使用して数の感覚の出現を理解することができると主張しています。大脳皮質の層V1、V2、およびV3と頭頂葉後部溝(IPS)のニューラルアーキテクチャを組み合わせることで、ニューラル表現の変化が理解できます。人間の脳の視覚皮質に類似して、V1、V2、V3、およびIPSはディープニューラルネットワークの視覚処理ストリームです。単一ユニットと分散人口レベルの両方で、学習を伴う数量のニューラルコーディングを調査することができます。 HAIの研究者は、ディープニューラルネットワークの画像の統計的特性により、視覚的な数感が生じ、数量感応性のあるニューロンが畳み込みニューラルネットワークで自発的に出現することを発見しました。彼らは畳み込みニューラルネットワークではなく、生物学的により現実的なアーキテクチャを持つ数-DNN(nDNN)モデルを使用しました。 ほとんどの現実の画像は非記号的な刺激から成り立っています。これらは数量のトレーニングを通じて数量表現にマッピングされ、解釈されます。研究者は、数量のトレーニングによって自発的に調整されたニューロンが変化し、階層性が生じることを発見しました。画像の研究において脳で使用される手順に類似して、研究者は表象類似性分析を実施し、情報処理にわたる数値量の分散表現がどのように出現するかを評価しました。 HAIの研究者は、非記号的な表現を抽象的な記号的表現にマッピングするとされる子供の数値スキルについて実験しました。これらは数値問題解決スキルの発達に重要です。これらの数の感覚と象徴的な数の処理能力は、別々の神経系に依存しています。違いにもかかわらず、子供はしばしば非記号的な表現を使って小さな数を学び、数え上げと算術原理を使って大きな数を学ぶ傾向があると研究は示しています。また、象徴的な数量と非記号的な数量の神経表現の類似性は、頭頂葉、前頭葉、および海馬が算術スキルと正の相関関係にあることを示しています。 神経心理学の研究のほとんどは、認知的な推論の出現を理解するために動物を対象に行われます。しかし、動物の脳には限界があります。理解の方法が実際に人間と同じかどうかは明確ではありません。人間のような理解の方法に関する研究がHAIと同様に行われることに解決策があります。これには、認知的に意味のある数の感覚の発達と数の表現の学習を、認知的および数学的な推論のような活動を行うために深層ニューラルネットワークをトレーニングすることによって理解するための重要な示唆があります。
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.