Search Results ML

データの壁を破る：ゼロショット、ワンショット、およびフューショットラーニングが機械学習を変革している

「ゼロショット、ワンショット、そしてフューショット学習の概念を発見しましょうこれらは、機械学習モデルが限られた数の例を用いてオブジェクトやパターンを分類・認識することを可能にします」

Machine learning

「ToolLLMをご紹介します：大規模言語モデルのAPI利用を向上させるためのデータ構築とモデルトレーニングの一般的なツールユースフレームワーク」

多くのツール（API）と効率的に接続し、困難なタスクを完了するために、ツール学習は大規模な言語モデル（LLM）の潜在能力を活用しようとします。 LLMは、APIとの接続により、消費者と大規模なアプリケーションエコシステムとの効果的な仲介役としての価値を大幅に高めることができます。オープンソースのLLMであるLLaMAやVicunaなどの指示チューニングにより、さまざまな機能を持つことができましたが、ユーザーの指示を理解し、ツール（API）との効果的なインターフェースを実現するなど、より高度なタスクを処理する必要があります。これは、現在の指示チューニングが主に単純な言語タスク（例：カジュアルチャット）に焦点を当てているためです。一方、ツールの使用に優れたスキルを持つGPT-4などの最新の状態-of-the-art（SOTA）LLMは、クローズドソースであり、内部動作に不透明です。そのため、コミュニティ主導のイノベーションやAI技術の民主化の幅が制約されます。このような観点では、オープンソースのLLMがさまざまなAPIを適切に理解できるようにすることが重要であると見なされています。以前の研究では、ツールの使用に対する指示チューニングデータの作成に取り組んでいましたが、内在的な制約により、LLM内のツールの使用能力を完全に刺激することはできませんでした。 (1) 制約されたAPI：現実のAPI（RESTAPIなど）を無視するか、十分な多様性を持たない狭い範囲のAPIのみを考慮しています。 (2) 制約されたシナリオ：既存の研究は、単一のツールのみを使用する指示に限定されています。一方、現実の設定では、多数のツールを組み合わせて多ラウンドのツール実行を行い、困難なタスクを完了する必要がある場合があります。さらに、多数のAPIが提供されている場合、ユーザーが特定のコマンドに最適なAPIセットを事前に決定することを前提としていますが、これは不可能です。 (3) 低品質な計画と推論：既存の研究では、モデルの推論のために単純なプロンプトメカニズム（チェーンオブソートやReACTなど）が使用されており、完全にLLMにエンコードされた能力を引き出すことができず、複雑な指示を処理することができません。これは、オープンソースのLLMにとって特に深刻な問題であり、SOTAのLLMよりも推論能力がはるかに劣っています。さらに、一部の研究では、後続のモデル開発において重要なデータである真の応答を取得するためにさえAPIを使用していません。彼らは、オープンソースのLLM内でツールの使用能力を刺激するためのデータ生成、モデルトレーニング、評価のための一般的なツール使用フレームワークであるToolLLMを提案します。図1は、APIリトリーバーとToolLLaMAのトレーニングを3つのステップで行い、ToolBenchを構築する方法を示しています。指示の推論中にAPIリトリーバーが関連するAPIをToolLLaMAに提案し、ToolLLaMAは最終結果に到達するために多くのAPI呼び出しを行います。ToolEvalは審議の全体プロセスを評価します。彼らはまず、図1に示すような高品質の指示チューニングデータセットであるToolBenchを収集します。最新のChatGPT（gpt-3.5-turbo-16k）を使用して、自動的に生成されます。表1には、ToolBenchと以前の取り組みの比較が示されています。特に、ToolBenchの作成には3つのステージがあります： • APIの収集：RapidAPI2から16,464のREST（表現状態転送）APIを収集します。このプラットフォームには、開発者によって提供される実世界のAPIが多数あります。これらのAPIは、eコマース、ソーシャルネットワーキング、天気など、49の異なる領域をカバーしています。各APIの包括的なAPIドキュメントをRapidAPIからスクレイプし、機能の要約、必要な入力、API呼び出しのためのコードサンプルなどを含めます。モデルがトレーニング中に遭遇しなかったAPIにも汎化するために、LLMがこれらのドキュメントを理解することでAPIを利用することを学ぶことを期待しています。 • Instruction Generation（指示生成）：彼らはまず、全体のAPIコレクションからいくつかのAPIを選び、ChatGPTにこれらのAPIに関するさまざまな指示を開発するように依頼します。シングルツールとマルチツールのシナリオをカバーする指示を選択し、実世界の状況をカバーします。これにより、モデルはさまざまなツールを個別に扱う方法と、それらを組み合わせて難しいタスクを完了する方法を学ぶことができます。 • Solution Path Annotation（解決経路の注釈）：彼らはこれらの指示に対する優れた回答をハイライトします。各応答には、モデルの推論とリアルタイムのAPIリクエストの複数のイテレーションが含まれる場合があります。最も高度なLLMであるGPT-4ですら、複雑なコマンドの成功率が低いため、ツールの学習の固有の難しさにより、データ収集が効果的でなくなります。このため、彼らはユニークな深さ優先探索ベースの意思決定木（DFSDT）を作成し、LLMsの計画と推論の能力を向上させることでこれに対処します。従来の思考の連鎖（CoT）やReACTに比べて、DFSDTはLLMsがさまざまな論理を評価し、戻るか続行するかを判断する能力を持たせます。研究では、DFSDTはCoTやReACTを使用して返答できない難しい指示を効果的に完了し、注釈の効率を大幅に向上させます。清華大学、ModelBest社、中国人民大学、イェール大学、WeChat AI、テンセント社、知乎社の研究者たちは、ChatGPTをサポートする自動評価システムであるToolEvalを作成し、LLMsのツール使用能力を評価しました。ToolEvalには2つの重要なメトリックが含まれています：（1）勝率（win…

AIシステム：発見されたバイアスと真の公正性への魅力的な探求

「人工知能（AI）はもはや未来の概念ではありません-それは私たちの生活の一部になっています Visaが1秒間に1,700件のトランザクションを検証し、...を検出するかを考えるのは難しいです...」

GoogleのSymbol Tuningは、LLM（Language Learning Models）におけるIn-Context Learningを行う新しいFine-Tuningテクニックです

言語モデルのスケーリングアップにより、機械学習は革命的な急増を経験し、インコンテキスト学習を通じて難しい推論タスクを達成することが可能になりましたしかし、一つの課題は…

「トップ12のコンピュータビジョンのGitHubリポジトリ」

AI＆MLの分野で学び続け、最新情報を追い続けるのに最適な場所の一つはGitHubですこの分野の異なる視点をカバーする本当に素晴らしいGitHubのリポジトリがあります

「2023年のスポーツアナリティクスについて知っておくべきこと」

スポーツのダイナミックな時代において、スポーツアナリストの役割はますます重要になっています。最新のトレンド、最先端の技術、革新的な手法を解明し、スポーツデータ分析を形作っています。ゲームの戦略から選手のパフォーマンス最適化まで、スポーツアナリティクスはチームや選手が準備し、競争し、成功する方法を革新しています。本記事では、スポーツアナリティクスの複雑さについて探求し、スポーツの結果、ファンの関与、そして常に変化するアスリートの卓越した景観に与える影響について議論します。経験豊富なスポーツアナリストであるか、好奇心旺盛な愛好家であるかに関係なく、データに基づいた洞察力の力を使ってスポーツの勝利の秘密を解き放つ準備をしてください！スポーツアナリティクスとは何ですか？スポーツアナリティクスは、選手のパフォーマンス、チームの戦略、選手のダイナミクスに対する洞察を得るために、データを収集、分析、解釈することを含みます。技術の進歩とスポーツの人気の高まりに伴い、データ分析はスポーツ業界でのゲームチェンジャーとして台頭しています。それはチームに貴重な情報を提供し、データに基づいた意思決定を行い、パフォーマンスを向上させることができます。同様に、ファンもデータ分析の恩恵を受けて、お気に入りのスポーツや選手についてより深い洞察を得ることができます。スポーツアナリティクスのデータはどのように役立つのですか？スポーツアナリティクスが役立ついくつかの方法は次のとおりです：意思決定意思決定において、スポーツアナリティクスのデータは過去のパフォーマンス、選手の統計、ゲームのシナリオについて重要な洞察を提供します。コーチやマネージャーは、この情報を利用して戦略、交代パターン、ゲームプランについての的確な意思決定を行い、チームの成功の可能性を高めることができます。選手選抜データ分析は、パフォーマンスと潜在能力を客観的に評価することで、選手選抜において重要な役割を果たします。スカウトやマネージメントは、パフォーマンスメトリクスを分析し、チームの要件と比較することで、チームのプレースタイルやニーズに適合する才能ある選手を特定することができます。選手のメカニクストレーニングスポーツアナリティクスのデータは、スポーツ科学者やトレーナーがトレーニングセッションや試合中に選手の生体力学を分析するのに役立ちます。この情報を活用して、選手のテクニックやフォームの改善点を特定し、個別のトレーニングプログラムを作成することができます。これにより、パフォーマンスを最適化し、怪我のリスクを減らすことができます。トレーニングスケジュールデータ分析は、アスリートのトレーニングスケジュールを最適化する上で重要な役割を果たしています。コーチは、ワークロードデータ、回復メトリクス、パフォーマンスの傾向を分析することで、強度と休息のバランスを取りながらトレーニングプログラムを設計することができます。これにより、パフォーマンスが向上し、過度なトレーニングや怪我のリスクを減らすことができます。試合中の戦術的調整試合中、スポーツアナリティクスのデータはリアルタイムの洞察を提供し、戦術的な調整の手助けをします。コーチは、選手やチームのパフォーマンスを評価し、相手のパターンを追跡し、弱点を特定することで、戦略的な意思決定を行い、競争上の優位性を得るために戦術を適応させることができます。怪我の予防と管理スポーツアナリティクスのデータは、アスリートの怪我のパターンやリスク要因を特定するのに役立ちます。選手のワークロード、生体力学、医療の歴史などのデータを分析することで、チームは予防措置を講じ、個別の回復計画を作成することができます。これにより、怪我のリスクを減らし、選手を健康に保つことができます。ゲーム戦略と戦術分析コーチは、スポーツアナリティクスのデータを使って相手のプレースタイル、強み、弱点について洞察を得ることができます。この情報を活用することで、効果的なゲーム戦略を立案し、リアルタイムデータに基づいて試合中の戦術的な調整を行うことができます。これにより、フィールド上での成功の可能性が高まります。パフォーマンスの向上スポーツアナリティクスのデータは、個々の選手とチーム全体の改善点を特定するのに役立ちます。コーチは、さまざまなパフォーマンスメトリクスを分析することで、特定のスキルやフィットネス要素を強化することができます。これにより、パフォーマンスが向上し、競争上の優位性が生まれます。ファンの関与とエクスペリエンススポーツアナリティクスのデータは、スポーツ団体がファンをよりよく理解するのに役立ちます。ファンの行動、好み、関与のパターンを分析することで、チームはマーケティングキャンペーン、ソーシャルメディアコンテンツ、ファンのエクスペリエンスをカスタマイズすることができます。これにより、サポーターとの強いつながりを作り、忠誠心を育むことができます。契約交渉とサラリーキャップの管理…

「OpenAIとLangchainを使用した言語的なメール作成Webアプリケーション」

はじめにこの記事では、Langchainの助けを借りてOpenAIを使用してウェブアプリケーションを構築する方法について説明します。このウェブアプリは、ユーザーが非構造化のメールを正しくフォーマットされた英語に変換することができます。ユーザーはメールのテキストを入力し、希望するトーンと方言（フォーマル/インフォーマルおよびアメリカン/ブリティッシュイングリッシュ）を指定することができます。アプリは選択したスタイルで美しくフォーマットされたメールを提供します。私たちは毎回スケールアプリケーションを構築することはできません。クエリとともにプロンプトをコピーして貼り付けるだけではありません。代わりに、さあ始めましょう、そしてこの素晴らしい「Professional Email Writer」ツールを構築しましょう。学習目標 Streamlitを使用して美しいウェブアプリケーションを構築する方法を学ぶ。プロンプトエンジニアリングとは何か、メールの生成に効果的なプロンプトを作成する方法を理解する。 LangchainのPromptTemplateを使用してOpenAI LLMをクエリする方法を学ぶ。 Streamlitを使用してPythonアプリケーションをデプロイする方法を学ぶ。この記事はData Science Blogathonの一部として公開されました。 Streamlitのセットアップまず、Streamlitが何であるか、どのように機能するか、そしてユースケースに設定する方法を理解する必要があります。Streamlitを使用すると、Pythonでウェブアプリケーションを作成し、ローカルおよびWeb上でホストすることができます。まず、ターミナルに移動し、以下のコマンドを使用してStreamlitをインストールします。 pip install streamlit スクリプト用の空のPythonファイルを作成し、以下のコマンドを使用してファイルを実行します。 python -m streamlit run [your_file_name.py]…

「Med-Flamingoに会ってください：医療分野向けのマルチモーダルな文脈学習を実行できるユニークな基盤モデル」

人工知能（AI）の人気が高まるにつれて、基礎モデルはラベル付きのインスタンスによって提供されるわずかな情報だけで、さまざまな問題を処理する驚異的な能力を示しています。コンテキスト内での学習のアイデアは、モデルのパラメータを調整せずに、いくつかの例からタスクを引き継がせる能力を持つため、注目を浴びています。医療分野と医療領域を考えると、コンテキスト内での学習は現在の医療AIモデルを指数関数的に改善する可能性があります。コンテキスト内での学習は医療データの複雑さと多様性、および達成しなければならないさまざまなタスクにより、医療環境での実装に困難を伴います。過去にはさまざまなマルチモーダル医療基礎モデルが試みられてきました。例えば、胸部X線を読むことに特化したChexZeroや、生物学の文献からのキャプションと関連付けられたさまざまな画像で訓練されたBiomedCLIPなどです。手術映像や電子健康記録（EHR）データにはいくつかのモデルが開発されています。しかし、これらのモデルにはマルチモーダル医療領域のコンテキスト学習は含まれていません。限界を克服するために、研究チームは医療領域に特化したユニークで高効果な基礎モデルであるMed-Flamingoを提案しています。このビジョン言語モデルは、コンテキスト内での学習とフューショット学習の能力を示す最初のビジョン言語モデルの1つであるFlamingoに基づいています。Med-Flamingoは、複数の医療分野からのマルチモーダルな知識源の事前トレーニングを提供することで、これらの能力を医療領域に拡大しています。最初のフェーズでは、信頼性の高い医療知識の信頼できるソースから4K以上の医療テキストからオリジナルの交互に配置された画像とテキストのデータセットを作成します。Med-Flamingoを評価するために、研究者たちは生成的な医療ビジュアルクエスチョンアンサリング（VQA）タスクに焦点を当てています。このタスクでは、モデルが事前定義された可能性を評価するのではなく、オープンエンドの回答を直接作成します。また、人間の評価スコアを主要なパラメータとする新しい現実的な評価プロセスが開発されました。さらに、困難なUSMLEスタイルのタスクを含むビジュアルUSMLEデータセットも開発されました。このデータセットには、画像や症例ビネット、検査結果も含まれています。 3つの生成的医療VQAデータセットで、Med-Flamingoは以前のモデルよりも臨床評価スコアで優れたパフォーマンスを示し、医師はモデルの予測を好む傾向があります。複雑な医療クエリに対応し、理由を提示することで、これまでにマルチモーダル医療基礎モデルが行っていなかった医療推論スキルを発揮しています。ただし、トレーニングデータの多様性とアクセスの容易さ、および一部の医療タスクの難しさによって、モデルの効果は制約される場合があります。チームは以下の貢献をまとめています。 Med-Flamingoは、医療領域に特化した最初のマルチモーダルフューショット学習者であり、根拠の生成やコンテキストの条件付けなどの新しい臨床応用を提供します。研究者たちは、医療領域でのマルチモーダルフューショット学習に適した、ユニークなデータセットを構築しました。彼らはまた、ビジュアルクエスチョンアンサリングにおける複雑な医療推論を取り入れたUSMLEスタイルの問題を含む評価データセットを導入しました。既存の評価戦略を批評し、医療評価者を巻き込んだ専用のアプリを使用してモデルのオープンエンドVQA生成を評価するための詳細な臨床評価研究が実施されました。

「マスタリングモンテカルロ：より良い機械学習モデルをシミュレーションする方法」

モンテカルロ：統計的シミュレーションが機械学習を支える方法、πの推定からハイパーパラメータの最適化までPythonでこの多目的なテクニックを使用するためのガイド

「生成AIとAmazon Kendraを使用して、エンタープライズスケールでキャプションの作成と画像の検索を自動化する」

Amazon Kendraは、機械学習（ML）によって駆動されるインテリジェントな検索サービスですAmazon Kendraは、ウェブサイトやアプリケーションのための検索を再構築し、従業員や顧客が組織内の複数の場所やコンテンツリポジトリに散らばっているコンテンツを簡単に見つけることができるようにしますAmazon Kendraはさまざまなドキュメントをサポートしています

Learn more about Search Results ML - Page 312