Learn more about Search Results A - Page 763

「データサイエンスにおける頻度論者とベイズ統計学」

はじめに 統計分析は、急速に発展しているデータサイエンスの分野において重要な役割を果たしており、研究者に洞察に富んだ知識をもたらしています。しかし、ベイズ主義と頻度主義の方法論の相違は常に対立してきました。これらの2つの戦略は異なる心構えと手続きを具現化しており、それぞれが独自の利点と欠点を提供しています。この記事では頻度主義とベイズ主義の統計を比較し、それぞれの核心的なアイデア、主要なテスト、および選択する際に考慮すべき主要な変数について明らかにします。 頻度主義とベイズ主義:概要 側面 頻度主義アプローチ ベイズ主義アプローチ 確率の解釈 客観的:確率は長期的な頻度または繰り返される実験の限定的な振る舞いを表す。 主観的:確率は先行知識とデータに基づく信念や不確実性を表す。 パラメータの取り扱い 固定:パラメータは固定された未知の定数です。推定では、データに基づいて「最適な」推定値を見つけることが求められます。 ランダム:パラメータは独自の確率分布を持つランダム変数として扱われます。先行信念とデータに基づいて更新され、事後分布が得られます。 先行情報 該当なし:通常、先行情報は分析に明示的に組み込まれません。 重要:ベイズ分析では、データを観測する前のパラメータに関する先行信念を表す事前分布を指定する必要があります。 推論アプローチ 仮説検定:p値と棄却領域を使用します。 信用区間:指定された確率でパラメータ値を推定するための信用区間を使用します。 不確実性の取り扱い 点推定:点推定(例:標本平均)とそれに関連する不確実性(例:信頼区間)。 確率分布:パラメータ推定の不確実性を直接モデル化する事後分布。 サンプルサイズの要件 大規模サンプル:正確なパラメータ推定にはしばしば大規模なサンプルサイズが必要です。 小規模サンプル:ベイズ法では、特に情報量の多い事前分布を使用することで、小規模なサンプルサイズでも合理的な推定が可能です。…

「機械学習モデルのバリデーション方法」

大規模な言語モデルは既にデータサイエンス業界を大きく変革しています最大の利点の一つは、ほとんどのアプリケーションにおいてそのまま使用できることです

スタンフォード大学とDeepMindの研究者が、大規模な言語モデル(LLMs)をプロキシ報酬関数として使用するアイデアを提案しました

コンピューティングとデータの発展に伴い、自律エージェントは力を増しています。エージェントが学習するポリシーに対して人間が何らかの意見を持ち、それが自分の目標と一致しているかを確認する必要性は、これを踏まえるとますます明白になっています。 現在、ユーザーは1)目的のアクションに対する報酬関数を作成するか、2)詳細なラベル付きデータを提供するかのいずれかを行っています。どちらの戦略も困難を伴い、実際には実装されることはないでしょう。報酬のハッキングに脆弱なエージェントは、競合するゴールの間にバランスを取る報酬関数の設計が難しい状況にあります。しかし、報酬関数は注釈付きの例から学習することができます。ただし、個々のユーザーの嗜好や目標の微妙さを捉えるためには膨大な量のラベル付きデータが必要であり、高コストがかかります。さらに、報酬関数は再設計するか、異なる目標を持つ新しいユーザーポピュレーションのためにデータセットを再収集する必要があります。 スタンフォード大学とDeepMindによる最新の研究では、ユーザーが好みを共有するのがより自然な方法で報酬関数を作成し、わずかなインスタンスのみを使用してそれらの好みを定義するための費用対効果の高いアプローチを設計することを目指しています。彼らの研究では、インターネットからの大量のテキストデータでトレーニングされ、極めて少数のトレーニング例でも文脈で学習することが得意な大規模言語モデル(LLM)を使用しています。研究者によれば、LLMは人間の行動に関する重要な常識的な事前知識を大規模なデータセットから取り込むため、文脈的な学習に優れています。 研究者たちは、ユーザーが提供するデータを使用してRLエージェントのトレーニングにプロンプト付きLLMを利用する方法を調査しています。提案された方法では、会話形式のインターフェースを使用してユーザーが目標を定義します。目標を定義する際には、「汎用性」といった数個のインスタンスや、共通の知識であれば1つの文を使用することがあります。プロンプトとLLMを使用して報酬関数を定義し、RLエージェントをトレーニングします。RLエピソードの軌跡とユーザーのプロンプトをLLMに入力し、軌跡がユーザーの目的を満たしているかどうかのスコア(例えば、「Yes」または「0」)をRLエージェントの整数報酬として出力します。LLMをプロキシ報酬関数として使用する利点の1つは、ユーザーが望ましい動作の数十の例を提供する必要がなく、言語を通じて直感的に好みを指定できることです。 ユーザーは、提案されたエージェントが異なる目標でトレーニングされたエージェントよりも目標に合致していると報告しています。共通の目標に関する事前知識を利用することで、LLMはゼロショットのプロンプトに対して生成される目標に合致した報酬信号の割合を、通常の順序の行列ゲームの場合には平均48%、シャッフルされた順序の場合には36%増加させます。最終的なゲーム、ディールまたはノーディールの交渉課題、およびマトリックスゲームでは、チームはいくつかのプロンプトのみを使用してプレーヤーをガイドします。パイロットスタディでは10人の実際の人物が使用されました。 LLMは、ワンショットの状況でも共通の目標を認識し、それらの目標と一致する強化信号を送信することができます。したがって、目的に合致したRLエージェントをトレーニングするためには、1つの正しい結果のみを検出するLLMを使用することができます。その結果、ラベルを使用してトレーニングされるエージェントよりも正確なものになる可能性が高くなります。

新しい研究は、ソフト自己駆動摩擦電気ナノ発電装置と深層学習支援データ分析に基づく水中3次元触覚テンセグリティ(U3DTT)を提案しています

「AUV」とは「自律型水中無人機」の略で、深海の下にあるものを発見するために広範な応用があります。この深海の下にあるものは探索や到達が困難であり、AUVはそれらの問題を探知することができず、海中に存在する岩石や土壌の狭い空間や細長い充填物に到達することができません。研究グループの前には、深海環境に関する適切なデータを提供するため、各部分に到達できる技術を構築するという明確な問題がありました。 この問題に対処するため、研究者たちは「U3DTT」という技術を開発しました。U3DTTは「水中三次元触覚テンセグリティ」の略で、ニューラルネットワーク、オートエンコーダ、ボルツマンマシンなどのディープラーニングアルゴリズムを利用します。このデバイスはトライボ電気メカニズムに基づいており、トライボ電気センサーを備えています。デバイスがキャプチャした3D情報は、センサーの出力電圧を一定に保つことで抽出できます。これにより、衝突するAUVに触覚フィードバックを提供し、高い弾性速度で生き残ることを保証します。ディープラーニングをベースとしたAUVであるU3DTTは、AUVと統合され、正確な姿勢を推定し、前のAUVによって誤って発射された自然環境を修正しました。また、ディープラーニング技術に関連するさまざまな応用もあります。以下にそれらをリストアップします。 U3DTTデバイスは、ディープラーニングアルゴリズムを使用して実装されるロボティクスの分野で応用があります。高い感度と自由度を持つため、AUVに比べて高速な応答が可能です。U3DTTデバイスは、3Dセンシングフィードバックを提供するロボットによって自動化されています。また、陸上の植物や動物の構造に影響を受け、それに応じて条件を模倣します。主な認識は水中の音と流体力学的特性に基づいており、これらはターゲットに関する情報を提供します。これらの結果は、地下ロボット工学の驚異的な進歩を示しています。これは人工知能の分野での地下応用でした。 研究の結果から、U3DTTは姿勢を推定することで地下の3D空間に存在するすべての障害物について情報を提供できることが証明されました。研究者たちは、将来のナノジェネレーターが制限された水域での情報収集やデータ分析の問題を大幅に解決できることを期待しています。人工知能に基づく多くの水中インテリジェント機器やさらなる進歩が近い将来に現れるでしょう。

「最新のゲームをクラウド上で初日からプレイしよう」

今週のGFN Thursdayは、GeForce NOWでストリーミングされるいくつかの新作タイトルでパーティが開催されます。今週は新たに4つのゲーム、Xenonauts 2、Viewfinder、Techtonicaがクラウドに参加しますので、ゲームの素晴らしさを存分に楽しんでください。 Portalのファンの皆さん、お楽しみに — Portal: Prelude RTX modが近くGeForce NOWでメンバー向けにストリーミングされます。 さらに、メンバーが今後のGuild Wars 2でプレミアムな報酬を手に入れる方法もお知らせします。 お早めにゲット! GeForce NOWのライブラリには、1,600以上のゲームから選べます。クラウドデビューを果たすタイトルから選んでください。高性能なGeForce RTXゲーミングリグでクラウド上でXenonauts 2、Viewfinder、Techtonicaを最初に体験してください。ダウンロード時間やシステムの仕様に心配することなく、思い切り楽しんでください。 クラウドで新たな視点を見つけてください。 新作シングルプレイヤーゲーム、Viewfinderでは、Thunderful Publishingから新しい視点を見つけてください。インスタントカメラを使って写真を撮り、シーンに配置することで、現実を再定義し、周囲の世界を変えていく、この心を捉える冒険を楽しんでください。 仕事に取りかかりましょう! 異なる世界を求める方は、Fire…

「Gensimを使ったWord2Vecのステップバイステップガイド」

はじめに 数か月前、Office Peopleで働き始めた当初、私は言語モデル、特にWord2Vecに興味を持ちました。ネイティブのPythonユーザーとして、私は自然にGensimのWord2Vecの実装に集中し、論文やオンラインのチュートリアルを探しました。私は複数の情報源から直接コードの断片を適用し、複製しました。私はさらに深く探求し、自分の方法がどこで間違っているのかを理解しようとしました。Stackoverflowの会話、GensimのGoogleグループ、およびライブラリのドキュメントを読みました。 しかし、私は常にWord2Vecモデルを作成する上で最も重要な要素の一つが欠けていると考えていました。私の実験の中で、文をレンマ化することやフレーズ/バイグラムを探すことが結果とモデルのパフォーマンスに重要な影響を与えることを発見しました。前処理の影響はデータセットやアプリケーションによって異なりますが、この記事ではデータの準備手順を含め、素晴らしいspaCyライブラリを使って処理することにしました。 これらの問題のいくつかは私をイライラさせるので、自分自身の記事を書くことにしました。完璧だったり、Word2Vecを実装する最良の方法だったりすることは約束しませんが、他の多くの情報源よりも良いと思います。 学習目標 単語の埋め込みと意味的な関係の捉え方を理解する。 GensimやTensorFlowなどの人気のあるライブラリを使用してWord2Vecモデルを実装する。 Word2Vecの埋め込みを使用して単語の類似度を計測し、距離を算出する。 Word2Vecによって捉えられる単語の類推や意味的関係を探索する。 Word2Vecを感情分析や機械翻訳などのさまざまな自然言語処理のタスクに適用する。 特定のタスクやドメインに対してWord2Vecモデルを微調整するための技術を学ぶ。 サブワード情報や事前学習された埋め込みを使用して未知語を処理する。 Word2Vecの制約やトレードオフ、単語の意味の曖昧さや文レベルの意味について理解する。 サブワード埋め込みやWord2Vecのモデル最適化など、高度なトピックについて掘り下げる。 この記事はData Science Blogathonの一部として公開されました。 Word2Vecについての概要 Googleの研究チームは2013年9月から10月にかけて2つの論文でWord2Vecを紹介しました。研究者たちは論文とともにCの実装も公開しました。Gensimは最初の論文の後すぐにPythonの実装を完了しました。 Word2Vecの基本的な仮定は、文脈が似ている2つの単語は似た意味を持ち、モデルからは似たベクトル表現が得られるというものです。例えば、「犬」、「子犬」、「子犬」は似た文脈で頻繁に使用され、同様の周囲の単語(「良い」、「ふわふわ」、「かわいい」など)と共に使用されるため、Word2Vecによると似たベクトル表現を持ちます。 この仮定に基づいて、Word2Vecはデータセット内の単語間の関係を発見し、類似度を計算したり、それらの単語のベクトル表現をテキスト分類やクラスタリングなどの他のアプリケーションの入力として使用することができます。 Word2vecの実装 Word2Vecのアイデアは非常にシンプルです。単語の意味は、それが関連する単語と共に存在することによって推測できるという仮定をしています。これは「友だちを見せて、君が誰かを教えてあげよう」という言葉に似ています。以下はword2vecの実装例です。…

「GPT-4の能力と限界を探索する」

「GPT-4の公開:データサイエンスへの影響を解読し、その強みと限界を探る」

「モデルの解釈性のためのPFIに深く入り込む」

「モデルの評価方法を知っていることは、データサイエンティストとしての仕事において不可欠ですステークホルダーに完全に理解し、伝えることができない場合、誰もあなたの解決策に同意しません...」

NumPyを使用した効率的なk最近傍(k-NN)解

「NumPyの高度な機能を使って、k最近傍法(k-NN)問題を効率的に解決する方法を学び、ブルートフォースのPythonソリューションとのパフォーマンスを比較しましょう」

「ニューラルネットワークとディープラーニングの基礎の理解」

この記事は、ニューラルネットワークとディープラーニングの基礎について詳細な概要を提供することを目的としています

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us