Search Results A

革新的なAI会社Ludaが革命的なリアルタイム強化学習システムを発表

2023年9月27日、テクノロジー界は画期的な出来事を経験しましたLudaという革新的な企業が人工知能（AI）の普及を目指して登場しましたLudaは一般の人々に、魅力的なサンドボックス体験を通じて学習プロセスに遊びを統合することで、独自のAIエンティティを構築し、育成し、展開する力を与えます経験豊富な専門家で構成されています […]

「金融分野における生成型AI：FinGPT、BloombergGPT そしてその先へ」

「Generative AI」とは、入力データに似た新しいデータサンプルを生成できるモデルのことを指します「ChatGPT」の成功により、企業が独自の大規模言語モデルを設計するための機会が多く生まれ、様々な業界で革新的なアイデアが生まれていますデータによって推進される金融セクターは、今や以前よりもデータ集約的です私はデータサイエンティストとして働いています[…]

デジタルCXチャンネルの調和：現代の組織におけるチャットボットとChatGPTの四つの四分位相互作用モデル

技術、特に自動化を使用する利点は、既に多くの情報源と報告によって議論され、数量化され、検証されていますそのうちの一部の利点は、費用効率の向上などです...

「AIの助けを借りて生産性を向上させる方法」

起業家であり、CEOとして、私は常に生産性と効率を向上させる方法を探し続けていますそれが私が人工知能に情熱を注ぎ、私たちの働き方を変革することができる方法について熱心になった理由です過去の1年間でAIに深く没頭した結果、創業者や役員である限り誰もが驚くほどの利益を得られることを目の当たりにしています

thought leaders

新たなGoogle.orgの助成金により、30万人の学生がロボット技術とAIに触れることができます

Googleの25周年記念に、Google.orgはロボットプログラムとAI教育を支援するために1000万ドルの助成金を提供しています

LMSYS-Chat-1Mとは、25の最新のLLM（Large Language Models）を使用して作成された、100万件の実世界の会話を含む大規模データセットです

大規模言語モデル（LLM）は、仮想アシスタントからコード生成まで、さまざまなAIアプリケーションに不可欠な存在となっています。ユーザーは、異なる目的に応じて特定のクエリや質問形式を使用してLLMと関わる際に、その行動を適応させます。これらのパターンを研究することで、さまざまなLLMへのユーザーの期待や信頼についての洞察を得ることができます。さらに、単純な事実から複雑な文脈を持つクエリまでの質問の範囲を理解することで、LLMのサービス向上、誤用の防止、AIの安全性の向上に役立つでしょう。以下のように言えます：大規模言語モデルサービスの運営コストが高いため、多くの組織にとって実際のユーザーの質問データを収集することは財務的に難しいです。実際のユーザーの質問データを持っている企業は、競争上の優位性を明らかにする懸念やデータプライバシーの維持を望むため、それらを共有することにためらっています。オープンな言語モデルとのユーザーの対話を促すことは難しい課題です。なぜなら、これらのモデルは主要企業が開発したモデルほどの性能を発揮しないからです。オープンなモデルとのユーザーの関与の困難さから、調査目的のためにこれらのモデルとの実際のユーザーの対話を正確に反映した大規模データセットを編成することは困難です。このギャップに対応するために、本研究では「LMSYS-Chat-1M」という革新的な大規模な実世界データセットを紹介しています。このデータセットは、大規模言語モデル（LLM）とユーザー間の実際の対話の広範なコレクションから慎重に収集されました。これらの対話は、オープンソースと独自のモデルの両方を含む25の人気のあるLLMへのアクセスを提供する無料のオンラインLLMサービスをホスティングすることで、5か月間にわたって収集されました。このサービスには、数千時間にわたるA100の計算リソースが必要でした。ユーザーの関与を維持するために、著者らは「チャットボットアリーナ」と呼ばれる競争的な要素を実装し、人気のLLMのランキングとリーダーボードを定期的に更新することでユーザーにサービスの利用を促しました。その結果、LMSYS-Chat-1Mには100万以上のユーザー対話が含まれており、さまざまな言語とトピックをカバーしています。ユーザーは、データ収集ウェブサイトの「利用規約」セクションを通じて、このデータセットに対する使用の承諾を提供しました。このデータセットは、VicunaのデモとChatbot Arenaのウェブサイトから2023年4月から8月までに収集されました。このウェブサイトは、ユーザーに3つのチャットインターフェースオプションを提供しています：単一モデルチャット、チャットボット同士が戦うチャットボットアリーナ、および2つのチャットボットを横に並べて比較できるチャットボットアリーナ。このプラットフォームは完全に無料であり、ユーザーには補償も料金も課されません。この論文では、LMSYS-Chat-1Mを4つの異なるユースケースでの潜在的な応用を探求しています。LMSYS-Chat-1Mは、GPT-4と同等のパフォーマンスを発揮する強力なコンテンツモデレータとして小規模な言語モデルを効果的に微調整できることを示しています。さらに、一部の提供されたモデルにセーフティメカニズムがあるにもかかわらず、LMSYS-Chat-1Mには主要な言語モデルのセーフガードを挑戦できる対話が含まれており、モデルの堅牢性と安全性の研究のための新たなベンチマークとなります。さらに、このデータセットには、指示微調整に適したユーザーと言語モデルの質の高い対話も含まれています。これらの対話の一部を使用することで、Llama-2モデルは特定のベンチマークにおいてVicunaやLlama2 Chatと同等のパフォーマンスレベルを達成できることを著者らは示しています。最後に、LMSYS-Chat-1Mの幅広いトピックとタスクのカバレッジは、言語モデルのための新しいベンチマーク質問の生成において貴重なリソースとなります。

ZenMLとStreamlitを使用した従業員離職率予測

イントロダクション人事として働いていますか？チームの従業員が続けるかどうか、または組織を去ることを考えているかの予測に苦労していますか？心配しないでください！これを予測するために占星術師になる必要はありません。データサイエンスの力を使って、それを正確に予測することができます。簡単でパワフルなMLOpsツールであるZenMLとstreamlitと一緒に、従業員の離職率の素晴らしい旅を始めましょう。旅を始めましょう。学習目標この記事では、以下のことを学びます。 ZenMLとは？なぜ使うのか？どのように使うのか？なぜMLflowを使うのか？ZenMLとの統合方法は？デプロイメントパイプラインの必要性従業員の離職率プロジェクトの実装と予測の作成この記事は、データサイエンスブログマラソンの一部として公開されました。プロジェクトの実装問題の設定: 年齢、収入、パフォーマンスなどのいくつかの要素に基づいて、従業員が組織を去るかどうかを予測する。解決策: ロジスティック回帰モデルを構築して従業員の離職率を予測する。データセット: IBM HR Analytics Employee Attrition＆Performance [出典]: https://www.kaggle.com/datasets/pavansubhasht/ibm-hr-analytics-attrition-dataset プロジェクトの実装を見る前に、なぜここでZenMLを使用しているのかを見てみましょう。なぜZenMLを使用するのか？…

ビジネスにおけるAIパワードのテキストメッセージングの台頭

紹介近年、人工知能（AI）の統合、特に自然言語処理（NLP）と機械学習（ML）の発展によって、テキストベースのビジネスコミュニケーションの風景が根本的に変わりました。本記事では、AIによるテキストメッセージングの技術的な側面について詳しく探求し、基本的な概念、応用、利点、課題、そしてこの技術の将来について考察します。学習目標ビジネスにおけるテキストベースのコミュニケーションを変革する自然言語処理（NLP）や機械学習（ML）の役割を含む、AIによるテキストメッセージングの基本的な概念を理解する。トークン化、固有表現認識（NER）、品詞タグ付け、教師あり学習、単語の埋め込み、リカレントニューラルネットワーク（RNN）など、AIによるテキストメッセージングシステムの技術的な要素を探求する。カスタマーサポート、マーケティング、予約スケジュール、フィードバック分析など、さまざまな業界でのAIによるテキストメッセージングの実践的な応用に対する洞察を得る。この記事はデータサイエンスブログマラソンの一部として公開されました。 AIによるテキストメッセージングの理解人工知能は、私たちがテキストや対話をする方法を変えています。これらの技術的な要素は、AIによるテキストメッセージングシステムの構築要素であり、効果的なテキストベースの対話を理解、処理、生成するためのものです。会話技術の未来へのダイブとともに、AIによるテキストメッセージングの本質を見つけましょう。トークン化トークン化は、テキストをより小さな単位、通常は単語やトークンに分割する基本的なプロセスです。自然言語処理（NLP）やテキストメッセージングの文脈では、トークン化は重要なステップです。なぜなら、トークン化によって、連続していたり、連続性のある人間の言語をコンピュータが処理可能な離散的な単位に変換できるからです。例えば、文「The quick brown fox jumps.」をトークン化すると、[「The」、「quick」、「brown」、「fox」、「jumps」]のような個々のトークンに分割されます。固有表現認識（NER） NERは、テキスト内の特定のエンティティや要素を識別し分類するための技術です。これらのエンティティには、人名、組織名、日付、場所などが含まれます。AIによるテキストメッセージングでは、NERはメッセージ内の異なる要素の文脈と重要性を理解するのに役立ちます。例えば、「Apple Inc. was founded on April 1, 1976, in…

VoAGI ニュース、9月27日：ChatGPT プロジェクトのチートシート • PyTorch & Lightning AI の紹介

「10 シャットGPT プロジェクトチートシート • ディープラーニングライブラリ入門 PyTorch と Lightning AI • GPT-4 のトップ5の無料の代替手段 • マシンラーニング評価メトリックス理論と概要 • Poe とのキックアス中間進化のプロンプト」

NEWS

清華大学研究者がOpenChatを導入：ミックス品質データでオープンソース言語モデルを拡張する新しい人工知能AIフレームワークを紹介

自然言語処理の急速な進化において、大規模な言語モデルの能力は指数関数的に成長しています。研究者や組織は世界中で、これらのモデルの性能を向上させるために、さまざまな自然言語理解と生成のタスクで、これらのモデルの限界に挑戦し続けています。これらのモデルの進展の中でも重要な要素の一つは、それらが依存するトレーニングデータの品質です。この記事では、オープンソースの言語モデルの品質向上への取り組みについての研究論文について詳しく解説します。この研究では、混合品質のデータを使用してオープンソースの言語モデルを向上させる方法とその技術、自然言語処理への影響について探求しています。エキスパートが生成したデータと最適でないデータなどの混合品質のデータは、言語モデルのトレーニングにおいて重要な課題です。GPT-4のような最新のモデルによって生成されるエキスパートデータは通常高品質であり、トレーニングのゴールドスタンダードとして機能します。一方、GPT-3.5のような古いモデルからの最適でないデータは品質が低く、トレーニング中に課題を提供します。この議論対象の研究では、この混合品質のデータのシナリオに対処し、オープンソースの言語モデルの指示に従う能力を向上させることを目指しています。提案された方法に入る前に、現在の言語モデルのトレーニングで使用されている現行の方法とツールについて簡単に触れてみましょう。これらのモデルを向上させる一つの一般的なアプローチは、教師ありのFine-Tuning（SFT）です。SFTでは、高品質のエキスパートデータを使用して、指示に従うタスクでモデルをトレーニングし、正しい応答の生成を導きます。さらに、強化学習Fine-Tuning（RLFT）の方法が人気を集めています。RLFTは人間からの好みのフィードバックを収集し、これらの好みに基づいて報酬を最大化するようモデルをトレーニングします。清華大学は、オープンソースの言語モデルを混合品質のデータを使用して向上させる革新的な方法を提案しました。その中心には、Conditioned Reinforcement Learning Fine-Tuning（C-RLFT）という新しいトレーニング方法があり、このトレーニング方法はトレーニングプロセスを簡素化し、報酬モデルへの依存を減らします。 C-RLFTは、品質に基づいて異なるデータソースを区別することにより、言語モデルの入力情報を豊かにします。この区別は、クラス条件付きポリシーの実装によって達成されます。このポリシーは、モデルがエキスパートが生成した高品質のデータと最適でないデータ（品質が低い）を区別するのに役立ちます。これにより、C-RLFTはモデルに明示的な信号を提供し、指示に従う能力を向上させることが可能です。 OpenChat、特にopen chat-13 bモデルのパフォーマンスは、さまざまなベンチマークで評価されています。その中でも注目すべきベンチマークの一つは、AlpacaEvalです。ここでは、モデルの指示に従う能力がテストされます。Openchat-13bは、LLaMA-2などの13兆パラメータのオープンソースモデルよりも優れた結果を示し、指示に従うタスクで高い勝率と優れたパフォーマンスを達成し、C-RLFT方法の有効性を示しています。研究チームが強調するデータの品質の重要性は、重要な点です。数量は限られていますが、エキスパートデータは言語モデルのパフォーマンスを向上させるために重要な役割を果たします。エキスパートデータと最適でないデータを区別し、C-RLFTの方法と組み合わせることで、モデルのパフォーマンスを劇的に向上させることができます。この結果は、言語モデルのトレーニングの成功を保証するために、品質の高いトレーニングデータを選定することの重要性を強調しています。意義と今後の研究 OpenChatのフレームワークとC-RLFTメソッドは、自然言語処理の将来において有望です。このアプローチは、トレーニングプロセスを簡素化し、複雑な報酬モデルへの依存度を低減することにより、研究や開発の新たな可能性を開拓します。また、品質の異なるデータへの対応も課題とされており、多様なトレーニングデータを効果的に活用する手段を提供します。まとめると、OpenChatは品質の異なるデータを活用してオープンソースの言語モデルを強化する革新的な解決策を提案しています。C-RLFTメソッドを導入することで、このアプローチはベンチマークでのパフォーマンスに表れているように、優れた指示に従う能力を実現しています。自然言語処理が進化し続ける中で、OpenChatのような革新的な技術はより効率的かつ効果的な言語モデルのトレーニングを可能にします。

Learn more about Search Results A - Page 187