Search Results Yi

ゲームプレイ再創造：AI革命

ゲームでAI革命を探求しましょう！この詳細な解説では、生成AIがゲームプレイを変革し、プレイヤーの興味を豊かにし、経済成長を促進していることが明らかになります

CMU（カーネギーメロン大学）およびNYU（ニューヨーク大学）の研究者たちは、大規模言語モデル（LLM）を用いたゼロショット時系列予測のための人工知能メソッド「LLMTime」を提案しています

“`html 他のテキストや音声、ビデオなどのシーケンスモデリングの問題といくつかの類似点があるにもかかわらず、時系列データは2つの特徴があり、特に困難であるとされています。集計された時系列データセットには、しばしば異なるソースからのシーケンスが含まれ、場合によっては欠損値があります。これは、通常、均一な入力スケールとサンプルレートを持つビデオや音声とは対照的です。さらに、気象情報や金融データなどの多くの時系列予測アプリケーションでは、通常、情報の一部しか含まれていない観測からの外挿が必要です。これにより、正確なポイント予測が非常に困難になり、不確実性の推定がますます重要になります。時系列モデリングのための事前学習は頻繁には使用されません。事前学習のデータセットが利用しやすくないためです。ただし、大規模な事前学習は、ビジョンとテキストの大規模ニューラルネットワークのトレーニングの重要な要素となっており、パフォーマンスがデータの利用可能性に直接比例するようになっています。そのため、ARIMAや線形モデルなどの基本的な時系列手法の方が、一般的なベンチマークではディープラーニング手法よりも頻繁に優れたパフォーマンスを示しています。著者は、大規模な言語モデル（LLM）が従来の手法の明確なバイアスと現代の深い理解の複雑な表現学習と生成能力とのギャップを埋める可能性があることを示しています。 LLMを事前学習済みモデルとして連続的な時系列予測アプリケーションに使用するために、研究者らは「LLMTIME2」という非常にシンプルなアプローチを示しています（図1に概説）。この手法では、時系列予測をテキストの次のトークン予測として扱い、時系列を数値の文字列として表現することで、頑健な事前学習済みモデルや確率的な機能（確率評価やサンプリングなど）を適用することが可能になります。彼らは(1)時系列を数値の文字列として効率的にエンコードする方法、および(2)離散的なLLM分布を連続的な確率密度に変換する方法を提供しています。これにより、多様な複雑な分布を記述することができ、高いパフォーマンスが達成できます。これらの戦略を使用することで、他のモデルが使用するダウンストリームデータを変更することなく、LLMTIMEがさまざまな問題に対して特化した時系列手法を上回るか匹敵することがわかりました。図1: 大規模言語モデル（LLM）を使用して、研究者らは、数値をテキストとしてエンコードし、テキストの補完としての潜在的な外挿を選択する時系列予測手法「LLMTIME」を提案しています。ターゲットデータセットに対してトレーニングされていない（つまり、ゼロショット）の場合でも、LLMTIMEはいくつかのよく知られた時系列アルゴリズムを上回ることができます。基本となるベースモデルの強さは、LLMTIMEのパフォーマンスと共にスケールすることに注意が必要です。RLHFなどのアラインメントを経るモデルはスケーリングトレンドに従わないことも注目すべきです。たとえば、セクション6では、GPT-4のパフォーマンスがGPT-3よりも悪いことが示されています。 LLMTIMEのゼロショットの性質には、次のような潜在的な利点があります：（1）LLMsのシンプルな適用を可能にし、ファインチューニング手順の専門知識やこれらの手続きに必要な大量の計算リソースの必要性を排除します。（2）トレーニングやファインチューニングに対して少ない情報を持つデータが限られた状況にも適しています。（3）広範な事前学習済みLLMsのパターン抽出能力を利用することで、特殊な時系列モデルの作成に必要なかなりの時間、努力、およびドメイン固有の専門知識を回避できます。彼らは、LLMsが単純または繰り返しのシーケンスに好みを示し、これらのバイアスが時系列の重要な特徴（季節性など）と一致していることを示し、LLMTIMEの優れたパフォーマンスの理由を理解するために詳しく調査しています。これらのバイアスに加えて、LLMsは多様な分布を表現し、容易に欠損データに対応することもできます。それは、時系列に特に役立ちます。彼らはまた、LLMsが追加の副次的情報を問い合わせたり、LLMsに予測の正当性を説明させたりすることが可能になる方法を示しています。最後に彼らは、パフォーマンスが大きさと共に向上する傾向にあること、ポイント予測の品質も不確実性表現の品質が向上すること、一般的に魅力的な予測性能の増大に加えて、GPT-4の不確実性キャリブレーションがGPT-3よりも悪いことを発見しました。これは、RLHFなどの介入の結果である可能性があります。 “`

シリコンボレー：デザイナーがチップ支援のために生成AIを活用

今日公開された研究論文によれば、生成AIは、最も複雑なエンジニアリングプロジェクトの1つである半導体設計を支援できる方法を示しています。この研究では、高度な専門分野の企業が、内部データを使用して大規模な言語モデル（LLM）を訓練し、生産性を向上させるアシスタントを作成することができることが示されています。半導体設計は非常に困難な職業の一つです。最先端のチップであるNVIDIA H100 Tensor Core GPU（上記）は、人間の髪の毛の1万分の1の幅の通りよりも10,000倍細いストリート上に接続された数百億のトランジスタで構成された計画された都市のように見えます。数多くのエンジニアリングチームが2年以上にわたり協力し、これらのデジタルメガシティを構築しています。一部のグループはチップの全体的なアーキテクチャを定義し、他のグループはさまざまな超小型回路を作成・配置し、さらに別のグループはその作業をテストします。それぞれの作業には専門的な方法、ソフトウェアプログラム、コンピュータ言語が必要です。 LLMに向けた広範なビジョン「私は大規模な言語モデルが時間の経過とともに、あらゆるプロセスを支援することになると考えています」と、筆頭著者であるNVIDIA ResearchのディレクターであるMark Ren氏は述べています。 NVIDIAの最高科学責任者であるBill Dally氏は、この論文をサンフランシスコで開催された年次の電子設計自動化（EDA）に関する国際会議で発表しました。「この取り組みは、特に高度な専門分野でも、内部データを使用して有用な生成AIモデルを訓練することができることを示しています。これは、半導体設計の複雑な作業にLLMsを適用するための重要な一歩です」とDally氏は述べました。 ChipNeMoの登場この論文では、NVIDIAのエンジニアが、社内データを使用して会社の内部データを生成し最適化するためのカスタムLLMであるChipNeMoを作成した方法について詳しく説明されています。長期的には、エンジニアはチップ設計の各段階に生成AIを適用し、全体的な生産性を大幅に向上させることを期待しています。Ren氏はEDA分野で20年以上のキャリアを持つエンジニアの一人です。 NVIDIAのエンジニアによる可能なユースケースの調査の結果、研究チームは3つのユースケースを開始することを選びました：チャットボット、コード生成器、および分析ツールです。初期のユースケース後者は、既知のバグの維持に関連する時間のかかるタスクを自動化するツールであり、これまでで最も好評を得ています。 GPUアーキテクチャとデザインに関する質問に回答するプロトタイプチャットボットは、早期のテストで多くのエンジニアが技術文書を迅速に見つけるのに役立ちました。コード生成ツールは、チップ設計のソフトウェアの一部を書くのに役立ちます。…

バイデン大統領がAI実行命令を発布し、安全評価、市民権のガイダンス、労働市場への影響に関する研究を要求しています

「この命令は、ホワイトハウスが以前に主要なAI企業から得た自発的な取り組みに基づいており、技術に対する最初の重要で拘束力のある政府の行動を表しています」

「AIガバナンスにおけるステークホルダー分析の包括的ガイド（パート1）」

「AIガバナンスジャーナルの前のエディションでは、AIガバナンスの12の基本原則を取り上げましたこれらの原則は、倫理的ジレンマの中で私たちを導くコンパスとして機能します効果的なAI...」

製造でのトピックモデリング

前回の記事では、ChatGPTを使ったトピックモデリングの方法と素晴らしい結果について話しましたタスクは、ホテルチェーンの顧客レビューを見て、言及されている主要なトピックを定義することでした...

コロンビア大学とAppleの研究者が『フェレット』を紹介します画像の高度な理解と説明のための画期的な多モーダル言語モデルです

モデルの空間的知識を促進する方法は、ビジョン言語学習の主要な研究課題です。このジレンマは、参照と基線という2つの必要な能力を必要とします。基準化では、モデルは提供された意味的な説明に応じて領域をローカライズする必要があります。一方、参照は、モデルが特定の提供された領域の意味を完全に理解することを求めます。本質的に、地理情報と意味を一致させることが、参照と基礎化の両方に必要な知識です。しかし、参照と道徳は通常、現在のテキストでは別々に教えられています。一方、人間は参照/基礎化能力を日常的な議論と推論にスムーズに組み合わせることができ、一つの活動から学び、共有知識を他の仕事に難なく一般化することができます。この研究では、前述の格差を考慮して、3つの主要な問題を調査しています。 (i) 参照と基礎化を1つのフレームワークに組み合わせる方法と、お互いを補完する方法は何ですか？ (ii) 点、ボックス、落書き、自由形状など、人々が物を指すためにしばしば使用する多くの領域をどのように描写しますか？ (iii) 実用的なアプリケーションにおいて必要とされる参照と基礎化を、オープンボキャブラリー、指示に従う、頑健なものにするにはどうすればよいですか？コロンビア大学とApple AI/MLの研究者は、これらの3つの問題に対応するために、全く新しい参照-基礎化マルチモーダル大規模言語モデル（MLLM）であるFerretを提案します。彼らは、まず、Ferretの基盤としてMLLMを選択しました。その理由は、MLLMが強力なビジョン言語のグローバルな理解力を持っているからです。図1に示されているように、Ferretは最初に平文数値形式の領域の座標を符号化して、参照と基礎化を統一します。図3: 提案されたFerretモデルのアーキテクチャの概要。左側には、提案されたハイブリッド領域表現と空間認識ビジュアルサンプラーが表示されています。全体のモデルアーキテクチャ（右側）。画像エンコーダは学習できない唯一のパラメータです。ただし、ストローク、落書き、複雑なポリゴンなど、さまざまな地域の形式を単一の点または座標のボックスで表現することは実用的ではありません。これらの形式は、より正確で包括的な人間とモデルの相互作用に必要です。この問題に対処するために、彼らはまた、可変スパース性を考慮した任意の形式の領域の光学的な特性を取得するための空間認識ビジュアルサンプラーを提案しています。そして、入力の視覚的な領域は、離散的な座標と連続的な視覚的特徴からなるハイブリッド領域表現を用いてFerretで表現されます。上記の手法を用いることで、Ferretは自由形式テキストと参照された領域を組み合わせた入力を処理することができ、指定されたアイテムを自動的に地域化オブジェクトとテキストの座標を作成して出力します。彼らの知る限りでは、Ferretはフリーフォームの領域を持つMLLMsからの入力を処理する最初のアプリケーションです。彼らはGRITというGround-and-Refer Instruction-Tuningデータセットを収集し、Ferretのオープンボキャブラリー、指示に従う、頑健さを作り出します。GRITには、領域、接続、オブジェクト、複雑な推論など、さまざまなレベルの空間的知識が含まれています。入力と出力の両方に位置とテキストを組み合わせたデータ、さらには位置内テキストアウト（参照）およびテキスト内位置アウト（基礎化）のデータも含まれています。注意深く作成されたテンプレートの助けを借りて、データセットのほとんどは、現在のビジョン（言語）タスク、例えばオブジェクト識別とフレーズ基礎化から指示に従うように変換されています。指示に従う、オープンボキャブラリーの参照-基礎化一般主義を訓練するために、ChatGPT/GPT-4を使用して34,000の参照-基礎化指示調整チャットを収集しました。また、モデルの頑健性を高めるために、空間的認識に関するネガティブデータのマイニングも行っています。Ferretは、オープンボキャブラリーの空間認識とローカリゼーション能力を持っています。従来の参照と基礎化の活動と比較した場合、より優れたパフォーマンスを発揮します。さらに、参照-基礎化の能力は、例えば、人々が馴染みのない物事を指し、その機能について尋ねるときなど、日常的な人間の議論に組み込まれるべきだと考えています。この新しいスキルを評価するために、Ferret-Benchを提案しています。それは、参照記述、参照推論、会話中の基礎化という3つの新しいタイプのタスクをカバーしています。既に使用されている最高のMLLMと比較して、Ferretは平均で20.4%の性能向上を示すことができます。Ferretはまた、オブジェクトの幻覚を軽減する卓越した能力を持っています。彼らは全体的に3つの異なる貢献をしています。 (i) MLLMでの微細なグラウンディングとリファレンスを可能にするFerretを提案しています。Ferretは、ユニークな空間感知ビジュアルサンプラーを備えたハイブリッドな領域表現を使用しています。 (ii) 彼らはモデルのトレーニングのための大規模な調整データセットであるGRITを作成しました。また、モデルの抵抗力を強化するために余分な空間的なネガティブな例も含まれています。リファリング/グラウンディング、意味、知識、推論を同時に評価するタスクを評価するために、彼らはFerret-Benchを作成しました (iii)。彼らのモデルは、さまざまな活動で他のモデルよりも優れた性能を発揮し、オブジェクトの妄想が少ないです。

データサイエンスのためのトップ10のTableauプロジェクト

イントロダクションデータサイエンスの世界には技術的な専門知識を持つ多くの候補者がいますが、問題解決に優れた人材はごくわずかです。これらのスキルを効果的に伝えるためのコミュニケーション能力については、自然に得意な人もいますが、他の人は時間をかけてこの能力を開発することがあります。幸いにも、Tableauなどのツールの登場により、簡単な可視化オプションにアクセスできるようになりました。この文脈で、データサイエンスのためのトップ10のTableauプロジェクトを探ってみましょう。これらは、視覚化能力を高め、問題解決能力を増幅させ、潜在的な雇用主の前で実務経験を示すのに役立ちます。初心者レベルのTableauサンプルプロジェクトのアイデア初心者レベルのTableauプロジェクトをお探しの場合は、これ以上探す必要はありません。以下はいくつかの最も簡単なプロジェクトのリストです: 患者リスク保健ダッシュボード医療分野の候補者は、患者データを使用して可能なリスクを分析し、データサイエンスにおける予測モデリングを行うことができます。特定の病院の患者やその他の任意の基準に基づく患者と関連した疾患の基本情報を収集することから始めると良いでしょう。分析によって健康へのリスク、特定の疾患の発症、または治療時間を予測することができます。患者リスク保健ダッシュボードをライン、棒グラフ、散布図を使って設計してください。販売予測分析ダッシュボードこのプロジェクトは初心者レベルのデータ分析とデータサイエンスを促進し、履歴書用のTableauプロジェクトとして効果的です。各チームや部門の販売数量などの情報を作成または取得して、特定のアイテムの次の期間の販売を分析および予測するために使用します。さまざまなツールを使用して値を予測し、自分の解釈に基づいて合理的なアイデアを提供します。販売傾向の時系列ラインチャート、実際の数量販売の棒グラフ、分析目的の傾向線によるダッシュボードを作成してください。マーケティングキャンペーンダッシュボードさまざまなマーケティングキャンペーンのパフォーマンスを分析するためにマーケティングデータを活用することができます。その結果、特定のマーケティングキャンペーンを続行したり中止したりするオプションを提案することができます。質問、セグメントの種類、およびそれぞれの異なる説明など、さまざまなデータタイプで構成される変数を利用して進めてください。回答と数を含む他の関連情報や分析を見つけ、要約された情報をトレンド分析によって示してください。セグメント分布を示すために円グラフを使用し、キャンペーンのパフォーマンスには棒グラフが適しています。マーケティングキャンペーン関連の可視化は非常に需要があります。航空運賃分析ダッシュボード航空産業はデータの可視化を活用しています。履歴書用のこの業界のTableauプロジェクトとして最適な問題設定は、フライト料金の予測です。ここでの練習プロジェクトは、特定の結果につながる複数のデータタイプと変数による上級レベルになります。それにはまた、探索的データ分析や隠れたパターンの特定も含まれます。後者は散布図で最もよく説明され、ヒートマップは価格の変動を示すために使用されます。犯罪分析ダッシュボード複数の変数を含む初心者レベルのプロジェクトのもう1つは、傾向を分析して予測するために重要です。また、犯罪者の次の行動を理解することで戦略を立案するのにも効果的です。データセットの関連性やプロジェクトの解決の緊急性を高めるための強度などのパラメータを含めることを検討してください。データの可視化を行い、期間に基づくパターンを求めてより深い理解を得てください。相関の散布図、トレンド分析のための折れ線グラフ、犯罪分布のためのツリーマップは、犯罪分析ダッシュボードの一般的なアイデアです。空気品質と公害分析ダッシュボードプロジェクトのソリューションは、経験のためにプロジェクトを展示し、環境保護産業におけるTableauプロジェクトを紹介することができます。ある特定の地域で汚染や汚染物に関するデータセットを分析することができます。分析は原因に深く入り、適切な対策を予測します。また、適切な行動を特定することにも焦点を当てています。作成されたダッシュボードには、バーや折れ線グラフなどの複数のチャートが含まれる場合があります。中級レベルのTableauプロジェクトのアイデア経験を要する職に応募する際には、以下のプロジェクトを検討してください：株式市場分析ダッシュボード市場において使用される株式市場分析は意思決定を支援します。特定の場所で現在の市場のトレンドに関する包括的な情報を保持するTableauプロジェクトGitHubダッシュボードを作成することができます。提示される情報には、面積グラフやトレンドグラフを通じた指標、株式や市場分析、株価足チャートやヒートマップを通じた他の関連情報などが含まれる場合があります。頻繁な変更に基づいた適切な可視化がここでは必要です。また、このセクターでは大容量のデータに精通していることが求められます。グローバルテロリズム分析ダッシュボードこのプロジェクトを通じて得られる経験と学習したスキルは、政府の役に立ちます。作成された可視化は、パターンの識別を通じて適切な戦略でテロリズムと戦う国々を支援するための正当な行動を支援します。これには、マップの描画と続いてライングラフや横棒グラフによる表現が含まれます。 COVID-19分析ダッシュボード健康産業の対応能力を示すための別の実用的なプロジェクトです。TableauプロジェクトGitHubダッシュボードを使用して、異なる地域での予測とリアルタイム分析を提供することができます。実際のCOVID-19の描写で使用されています。可視化は、さまざまな強度や他の要件に応じて大容量のデータの拡散を個別に表示できるようになっています。追加のアイデアについては、地理空間マップを使用して拡散を表示し、強度にはヒートマップ、日別のケースには折れ線グラフを使用することができます。…

VoAGIニュース、10月27日：データサイエンスをマスターするための5冊の無料の本 • LLMをマスターするための7つのステップ

今週のVoAGIで、大規模言語モデルの学習からLLMアプリの構築と展開までを7つのステップで行いますPython、統計学、線形代数、機械学習、ディープラーニングの学習に役立つ無料の書籍リストもチェックしてくださいさらに、他にもたくさんの情報があります！

Partners

決定科学がデザインと出会う” (Kettei kagaku ga dezain to deau)

デザインプロセスは、ここ数十年で劇的に変化しましたかつては人間の直感、判断力、美的な好みによって主導されていた領域が、現在では計算方法によって補完されています...

Learn more about Search Results Yi - Page 21