Search Results Jam

関数呼び出し：GPTチャットボットを何にでも統合する

OpenAIのGPTの新しい関数呼び出し機能を探索し、チャットボットが外部ツールやAPIと対話できるようにしますAIパワーを活用したアプリケーションの可能性を解き放つ

「機械に学習させ、そして彼らが私たちに再学習をさせる：AIの構築の再帰的性質」

「建築デザインの選択が集団の規範にどのように影響を与えるかを探索し、トレーニング技術がAIシステムを形作り、それが再帰的に人間の行動に影響を与える様子を見てください」

「プロセスマイニングとデジタルトランスフォーメーションによる産業4.0における業務の効率化の実現」

「業界に関係なく、デジタル技術は組織の間でますます人気を集めており、業績向上、収益成長、持続可能性の実現に向けて活用されています」

「ベストインクラスのセッションが開催中：新しいNVIDIA Studioノートパソコンがコンテンツ、ゲーム、教育を超高速化する」

編集者注：この投稿は、週刊NVIDIA Studioシリーズの一部であり、注目のアーティストを紹介し、クリエイティブなヒントやトリックを提供し、NVIDIA Studioテクノロジーがクリエイティブなワークフローを向上させる方法を示しています。また、新しいGeForce RTX 40シリーズGPUの機能、技術、リソースについても詳しく説明し、コンテンツの作成を劇的に加速する方法について深堀りしています。新学年の始まりは、学生がNVIDIA Studioラップトップを手に入れて、コンテンツの作成、ゲーム、教育の能力をアップグレードする理想的な時期です。これらのラップトップは、GeForce RTX 40シリーズのグラフィックスカードで動作します。 Marmoset Toolbagは、完全な3Dアート制作ツールであるバージョン4.06をリリースしました。これは、Toolbag 4ユーザー向けの無料アップデートで、OpenUSDファイル形式のサポートを拡張し、NVIDIA Omniverseとの互換性を追加し、NVIDIA DLSS機能、AI OptiXノイズリダクション、およびレンダリングとベイキングの高速化を提供します。すべてがRTXでアクセラレートされます。最後に、今週のNVIDIA Studioで人気のあるインフルエンサーであるJiffyVFX氏が、120万回以上再生された「Doors to Realities」というバイラルビデオシリーズについて話します。創造、ゲーム、学習 GeForceとNVIDIA Studio RTX 40シリーズのラップトップは、AIの力を利用してコンテンツの作成、ゲーム、学習アプリを高速化します。…

「AIが、人間が想像もできない高効果な抗体を作り出している」

「ロボット、コンピュータ、アルゴリズムは、人間ができない方法で潜在的な新しい治療法を探し求めています」

「開発者向けのAIツール15個（2023年8月）」

Otter AI 人工知能を使用して、Otter.AIはユーザーにリアルタイムの会議のメモの音声文字起こしを提供し、共有可能で検索可能、アクセス可能、安全なものにします。音声を録音し、メモを書き、スライドを自動的にキャプチャし、要約を生成する会議アシスタントを手に入れましょう。 Notion AI Notionワークスペース内で、AIアシスタントNotionは、創造性、改訂、要約など、さまざまな文章関連のタスクをサポートすることができます。メール、求人募集、ブログ投稿など、さまざまな文章作成タスクのスピードと品質を向上させます。Notion AIは、ブログやリストからブレインストーミングセッションや創作活動まで、さまざまな文章タスクを自動化するために使用できるAIシステムです。NotionのAI生成コンテンツは、ドラッグアンドドロップのテキストエディタを使用して簡単に再編成および変換できます。 Gretel.ai Gretel AIは、実際のデータを模倣しながらユーザーのプライバシーを保護する合成データの作成プラットフォームです。Gretel.aiのAPIを使用すると、プログラマーは匿名化された暗号化された合成データを簡単に作成できます。これにより、プライバシーを保護しながらイノベーションを促進できます。このプラットフォームには、AIモデルを迅速かつ簡単にトレーニングし、ユースケースを検証し、必要に応じてデータを生成するために必要なすべての機能が備わっています。技術的および非技術的なユーザー向けのサンプルノートブックや使いやすいオンラインアプリケーションにより、開発者は合成データを探索できます。Gretel AIを使用して、必要なすべてのプライバシー要件を満たしながら、合成データを利用できるようになります。 Pieces for Developers Pieces for Developersは、AIを活用したスニペットマネージャーです。開発プロセス全体でコードを保存、作成、充実させ、再利用し、配布することができます。デスクトップソフトウェアと既存の開発ツールとの統合スイートにより、ウェブブラウザでの調査、チームとの作業、統合開発環境（IDE）でのコードの記述時に効率を向上させることができます。1つの強力な中央ツールで、特定のリポジトリに合わせたコードを生成したり、スクリーンショットからコードを抽出したり、コードにインラインコメントを自動的に追加したりすることができます。無料リソースを活用して、コーディングの時間と労力を節約しましょう。 LangChain LangChainフレームワークは、ソフトウェアアプリケーションでの大規模な言語モデルの扱いを簡素化するために作成されました。さまざまなコンポーネントに対するモジュラーな抽象化と実装を提供することで、言語モデルの扱いを簡素化します。また、LangChainのユースケース固有のチェーンを使用することで、ドキュメント分析、チャットボット、コード分析などのニッチな用途のアプリを開発者は迅速に作成および調整することができます。つまり、LangChainは、プログラマーに効率的に言語モデルを活用し、先進的なソフトウェアを作成するためのツールを提供します。 YOU You.comは、ユーザーのプライバシーを保護し、個別の検索体験を提供するAIパワードの検索エンジンです。多くの便利なAIパワードの機能と機能を備えたアプリケーションの統合スイートです。YOUwriteを使用して、人工知能を活用してブログ記事、メール、ソーシャルメディアの更新を作成できます。YOUを使用して、美しいAI生成の写真を発見し、作成できます。コードモードAIチャットでは、開発中にコードを書いてアシスタンスを受けることができます。スタディモードチャットを使用して、ウェブ上の資料にアクセスし、学習や新しい能力の獲得を行うことができます。自分自身を知りましょう。 AgentGPT AgentGPTは、ユーザーが作成した自律型AIエージェントの開発と配布を容易にするWebベースのシステムです。ユーザーが名前と目標を指定した後、エージェントは目標を達成するために言語モデルのカスケードを使用して反復的に行動を実行し、結果を評価し、新しい割り当てを作成します。AgentGPTは、さまざまな目標を達成するための個別化されたAIエージェントを構築するための強力なツールを開発者に提供します。 Jam…

「Stitch FixにおけるMLプラットフォーム構築からの学び」

この記事は元々、MLプラットフォームポッドキャストのエピソードであり、Piotr NiedźwiedźとAurimas GriciūnasがMLプラットフォームの専門家と一緒に、デザインの選択肢、ベストプラクティス、具体的なツールスタックの例、そして最高のMLプラットフォームの専門家からの実世界の学びについて話し合っていますこのエピソードでは、Stefan KrawczykがMLを構築する際に得た学びを共有しています...

MLOps

アバカスAIは、新しいオープンロングコンテキスト大規模言語モデルLLM「ジラフ」を紹介します

最近の言語モデルは長い文脈を入力として受け取ることができますが、それらが長い文脈をどれだけ効果的に使用しているかについてはさらなる知見が必要です。LLMsは長い文脈に拡張することができるのでしょうか？これは未解決の問いです。Abacus AIの研究者たちは、Llamaというモデルの文脈長の能力を開発するためのさまざまな手法を用いた実験を行いました。このモデルは、文脈長2048で事前学習されています。彼らはこれらのモデルをIFTを用いてスケール4および16で線形にスケールアップしました。モデルをスケール16にスケールアップすると、16kの文脈長または20-24kの文脈長までのワールドタスクを実行することができます。文脈長を拡張するための異なる手法には、線形スケーリング、回転位置埋め込み（RoPE）のフーリエ基底のスケーリング、フーリエ基底の切り捨て、および位置ベクトルのランダム化があります。Abacus AIの研究者たちは、これらの手法を実装することでRedPajamaデータセットとVicunaデータセットを組み合わせてfine-tuningしました。彼らは、線形スケーリングは堅牢であるが、モデルの文脈長を増加させることがわかりました。切り捨てとランダム化はパープレキシティのスコアが高いが、リトリーバルタスクでは性能が低い結果となりました。これらのモデルの評価には、LMSys、オープンブックの質問応答データセット、およびWikiQAからのデータセットを使用しました。LMSysデータセットは、文脈内の部分文字列を特定するために使用されました。WikiQAタスクは、Wikipediaのドキュメント内の情報に基づいて質問に答えるタスクです。チームは、Google Natural Questionsのショートアンサーフォーマットデータに基づいたQAタスクを構築しました。出力は、元のドキュメントからコピー＆ペーストした短い単語の回答だけであることを保証しています。これにより、LLMがどこを参照する必要があるのかを正確に特定することができ、回答を異なる位置に配置することで拡張された文脈長の各部分を効果的に評価することができます。彼らはまた、異なるサイズの同じWikipediaドキュメントの複数のバージョンを作成し、モデルのサイズにわたる公平な評価を行うことができました。 Wikipediaベースのデータセットの問題点は、モデルが事前学習されたテキストから回答を出力してしまうことです。研究者たちは、数値の回答のみを持つ質問からなる変更されたデータセットを作成することで、この問題を解決しました。彼らは回答とドキュメント内のすべての出現箇所を異なる数字に変更しました。これにより、モデルが事前学習テキストから再現する場合に誤った回答をするようになります。元のQAタスクをFree Form QA（FFQA）とし、変更されたタスクをAltered Numerical QA（AltQA）としました。 AbacusAIの研究者たちは、QAタスクの両バージョンのすべての例における存在精度を評価しました。存在精度は、モデルの生成された解答に回答が部分文字列として存在するかどうかを測定する指標です。彼らは、IFTによる精度の向上がモデルが達成できる文脈長の範囲を拡張しないことを観察しました。研究者たちは、スケールされた文脈とIFTの組み合わせによる性能の飛躍的な向上を示しています。彼らは、スケールされた文脈ファクターによって補間されたすべての位置で、FFQAでは2倍、AltQAでは2.5倍の改善を観察しました。最後に、彼らの研究は、テーマをより良く捉え、より簡単に表現することができるより大きな文脈の言語モデルを提案しています。

「2023年のスポーツアナリティクスについて知っておくべきこと」

スポーツのダイナミックな時代において、スポーツアナリストの役割はますます重要になっています。最新のトレンド、最先端の技術、革新的な手法を解明し、スポーツデータ分析を形作っています。ゲームの戦略から選手のパフォーマンス最適化まで、スポーツアナリティクスはチームや選手が準備し、競争し、成功する方法を革新しています。本記事では、スポーツアナリティクスの複雑さについて探求し、スポーツの結果、ファンの関与、そして常に変化するアスリートの卓越した景観に与える影響について議論します。経験豊富なスポーツアナリストであるか、好奇心旺盛な愛好家であるかに関係なく、データに基づいた洞察力の力を使ってスポーツの勝利の秘密を解き放つ準備をしてください！スポーツアナリティクスとは何ですか？スポーツアナリティクスは、選手のパフォーマンス、チームの戦略、選手のダイナミクスに対する洞察を得るために、データを収集、分析、解釈することを含みます。技術の進歩とスポーツの人気の高まりに伴い、データ分析はスポーツ業界でのゲームチェンジャーとして台頭しています。それはチームに貴重な情報を提供し、データに基づいた意思決定を行い、パフォーマンスを向上させることができます。同様に、ファンもデータ分析の恩恵を受けて、お気に入りのスポーツや選手についてより深い洞察を得ることができます。スポーツアナリティクスのデータはどのように役立つのですか？スポーツアナリティクスが役立ついくつかの方法は次のとおりです：意思決定意思決定において、スポーツアナリティクスのデータは過去のパフォーマンス、選手の統計、ゲームのシナリオについて重要な洞察を提供します。コーチやマネージャーは、この情報を利用して戦略、交代パターン、ゲームプランについての的確な意思決定を行い、チームの成功の可能性を高めることができます。選手選抜データ分析は、パフォーマンスと潜在能力を客観的に評価することで、選手選抜において重要な役割を果たします。スカウトやマネージメントは、パフォーマンスメトリクスを分析し、チームの要件と比較することで、チームのプレースタイルやニーズに適合する才能ある選手を特定することができます。選手のメカニクストレーニングスポーツアナリティクスのデータは、スポーツ科学者やトレーナーがトレーニングセッションや試合中に選手の生体力学を分析するのに役立ちます。この情報を活用して、選手のテクニックやフォームの改善点を特定し、個別のトレーニングプログラムを作成することができます。これにより、パフォーマンスを最適化し、怪我のリスクを減らすことができます。トレーニングスケジュールデータ分析は、アスリートのトレーニングスケジュールを最適化する上で重要な役割を果たしています。コーチは、ワークロードデータ、回復メトリクス、パフォーマンスの傾向を分析することで、強度と休息のバランスを取りながらトレーニングプログラムを設計することができます。これにより、パフォーマンスが向上し、過度なトレーニングや怪我のリスクを減らすことができます。試合中の戦術的調整試合中、スポーツアナリティクスのデータはリアルタイムの洞察を提供し、戦術的な調整の手助けをします。コーチは、選手やチームのパフォーマンスを評価し、相手のパターンを追跡し、弱点を特定することで、戦略的な意思決定を行い、競争上の優位性を得るために戦術を適応させることができます。怪我の予防と管理スポーツアナリティクスのデータは、アスリートの怪我のパターンやリスク要因を特定するのに役立ちます。選手のワークロード、生体力学、医療の歴史などのデータを分析することで、チームは予防措置を講じ、個別の回復計画を作成することができます。これにより、怪我のリスクを減らし、選手を健康に保つことができます。ゲーム戦略と戦術分析コーチは、スポーツアナリティクスのデータを使って相手のプレースタイル、強み、弱点について洞察を得ることができます。この情報を活用することで、効果的なゲーム戦略を立案し、リアルタイムデータに基づいて試合中の戦術的な調整を行うことができます。これにより、フィールド上での成功の可能性が高まります。パフォーマンスの向上スポーツアナリティクスのデータは、個々の選手とチーム全体の改善点を特定するのに役立ちます。コーチは、さまざまなパフォーマンスメトリクスを分析することで、特定のスキルやフィットネス要素を強化することができます。これにより、パフォーマンスが向上し、競争上の優位性が生まれます。ファンの関与とエクスペリエンススポーツアナリティクスのデータは、スポーツ団体がファンをよりよく理解するのに役立ちます。ファンの行動、好み、関与のパターンを分析することで、チームはマーケティングキャンペーン、ソーシャルメディアコンテンツ、ファンのエクスペリエンスをカスタマイズすることができます。これにより、サポーターとの強いつながりを作り、忠誠心を育むことができます。契約交渉とサラリーキャップの管理…

「Skill-it」とは、言語モデルの理解とトレーニングのためのデータ駆動型スキルフレームワークです

大規模言語モデル（LM）は、ソースコードの作成、オリジナルの芸術作品の作成、人との対話など、非常に能力が高いです。モデルの訓練に使用されるデータによって、これらのタスクを実行できるようになります。この訓練データを強化することで、特定のスキルを自然に引き出すことができます。訓練トークンの数が限られている場合、巨大なコーパスからこれらの能力に適したデータを選択する方法は明確ではありません。なぜなら、既存の最先端のLMデータ選択アルゴリズムのほとんどは、フィルタリングやさまざまなデータセットの組み合わせに関するヒューリスティックに依存しているからです。データがモデルの能力にどのように影響を与えるか、またこのデータを使用してLMのパフォーマンスを向上させる方法を記述するための形式的なフレームワークが必要です。彼らは、人々が学ぶ方法からこのフレームワークを作成するためのヒントを得ました。学習階層を構成する能力という概念は、教育文献でよく知られています。たとえば、研究によって、数学や科学の概念を特定の順序で提示することが、生徒がそれらをより迅速に理解するのに役立つことが明らかになりました。彼らは、LMの訓練にどれだけ類似したスキルベースの順序付けが存在するかを知りたいと考えています。もし類似した順序付けが存在する場合、データ効率の良いトレーニングとLMのより深い理解を提供するかもしれません。たとえば、スペイン語の文法や英語の質問作成など、似たようなが容易なタスクからトレーニングを開始することが、スペイン語の質問生成のためのLMのトレーニングに役立つのかを知りたいと考えています。図1:彼らは、LMがある特定の順序でスキルを最もよく学び、これがLMをより理解し教えるのに役立つ可能性があると仮説を立てました。この仮説は、人間が情報を獲得する方法からのインスピレーションを得ました。彼らは、これらの順序付けられたスキルセットが実際のデータに存在することを示し、必要なスキルがトレーニングされている場合、データを少なくとも使用することで能力を学ぶことができることを実証しました。そして、彼らはスキルオーダリングを活用したオンラインのデータ選択システムであるSKILL-ITを導入し、スキルを迅速に獲得するために使用しました。彼らは、スキルの順序付けの概念がデータとLMの訓練および振る舞いを結び付けるためのフレームワークの開発に役立つ可能性があるかどうかを調査しています。これを行うためには、データとスキルの相互作用に関連する2つの問題を解決する必要があります。まず、LMのスキルとスキルの順序の操作的な定義を定義し、データを使用してテストする必要があります。これにより、LMが特定の順序で最も効果的に学習する能力のセットが存在することが示されます。初期の研究では、メタデータのプロパティや埋め込みクラスタなどの意味的なグループ化がスキルを適切に表現し、モデルの学習プロセスを説明できるかどうかを調査しました。たとえば、Alpacaデータセットを指示の種類で分割してデータの多様性を捉えました。しかし、指示の種類に基づいてサンプリングする方法とランダムサンプリングは、類似したパフォーマンスのモデルを生成することがわかりました。つまり、単に既存のデータグループのアイデアではスキルを特徴付けることはできません。モデルのトレーニングを本当に向上させるには、これらのスキルの定義を使用してサンプルの分布を構築する必要があります。単純な選択技術が直面する困難に着目し、スキルを効果的に学ぶデータ選択アルゴリズムの基準を作成します。能力のバランスや順序が従来のランダム一様サンプリングの技術では考慮されていないため、スキルの学習は最適化されていません。たとえば、スペイン語と質問生成（QG）は、Natural Instructionsデータセットのそれぞれ5％と4％を占めていますが、スペイン語QGはわずか0.2％です。スキルはデータ内で均等に分布しておらず、より複雑なスキルは稀です。また、ランダムサンプリングは特定のトレーニングシーケンスやスキルの依存構造を考慮する方法を提供しません。サンプルレベルの順序付けは、カリキュラム学習などのより高度な戦略によって考慮されますが、スキルやその依存関係によっては考慮されません。能力の不均衡や順序の問題は、彼らの目標のフレームワークによって考慮される必要があります。スキルベースのシステムとして、モデルが関連するデータのスライスを使用して学習することができる行動の単位としてスキルを定義します。順序付けられたスキルセットは、フルでも空でもない有向スキルグラフを持つスキルのグループです。前提となるスキルからスキルへのエッジが存在する場合、前提スキルも学習されることでスキルの学習に必要なトレーニング時間を短縮できます（図1の左、中央）。この操作的な定義を使用して、人工および実データセットに順序付けられたスキルセットが存在することを実証します。興味深いことに、これらの順序付けられたスキルセットは、スキルだけでなく必要なスキルもトレーニングすることで、才能を迅速に学ぶ必要があることを明らかにします。彼らの観察によると、モデルが英語QGとスペイン語を追加して学習すると、総合的なトレーニングステップの予算を使って単にスペイン語QGでトレーニングするよりも、検証損失が4%低くなる場合があります。その後、彼らの理論に基づいて、LMがスキルをより速く学習するための2つのアプローチを提供しています：スキル層別サンプリングとオンライン汎化、SKILL-IT。スタンフォード大学、ウィスコンシン大学マディソン校、Together AI、シカゴ大学の研究者たちは、スキル層別選択を提案しています。これは、データセット内のスキルの不均等な分布の問題を解決するために、関連スキル（目標スキルや微調整のための必要スキルなど）を均等にサンプリングすることで学習スキルを明示的に最適化する直接的な方法です。スキル層別サンプリングは静的であり、トレーニングの進行に伴う順序を考慮しませんので、トレーニングプロセスの初期段階で獲得された能力を過剰にサンプリングします。彼らはSKILL-ITを提案し、トレーニングスキルの組み合わせを選択するためのオンラインデータ選択技術を提供して、まだ学習していないスキルや影響力のある前提スキルにより高い重みを与えることで、この問題に対処します（図1 右）。データの予算とスキルグラフを仮定した場合、SKILL-ITは評価スキルの損失を最小化するためのトレーニングスキル上のオンライン最適化問題から開発されます。評価スキルセットとトレーニングスキルセットの関連を基に、SKILL-ITは進行中の事前学習、微調整、またはドメイン外評価に適応することができます。これはオンラインミラーディセントに触発されたものです。人工データセットと実データセット上で、彼らは2つのモデルスケール（125Mと1.3Bパラメータ）でSKILL-ITを評価します。LEGOシミュレーションでは、ランダムにトレーニングデータとカリキュラム学習を選択する場合と比べて、連続的な事前トレーニングシナリオにおいて35.8ポイントの精度向上を実証します。同じ総合的なトレーニング予算の場合、スキルの組み合わせによる彼らのアルゴリズムは、微調整の設定で単独のスキルだけでトレーニングするよりも最大13.6%低い損失を達成することを示しています。彼らのアルゴリズムは、自然な指示テストタスクデータセットのタスクカテゴリに対応する12の評価スキルのうち11つでランダムサンプリングやスキル層別サンプリングに比べて最も低い損失を達成することができます。これはトレーニングスキルが評価スキルと完全に一致しないドメイン外の設定でのトレーニングデータに対して行われます。最後に、彼らは最新のRedPajama 1.2兆トークンデータセットを使用した事例研究を提供しています。彼らはSKILL-ITによって生成されたデータ混合物を利用して3Bパラメータモデルを連続的に事前トレーニングします。彼らは、1Bトークンにおける精度に関して、SKILL-ITが3Bトークンのデータソース上の均等なサンプリングを上回ることを発見しました。

Learn more about Search Results Jam - Page 8