Search Results A

「ゲイリー・ヒュースティス、パワーハウスフォレンジクスのオーナー兼ディレクター- インタビューシリーズ」

ゲイリー・ヒュースティス氏は、パワーハウスフォレンジックスのオーナー兼ディレクターであり、ライセンスを持つ私立探偵、認定データリカバリプロフェッショナル（CDRP）であり、インフラガードのメンバーでもあります彼は多岐にわたるケースにおいて数百件の鑑識調査を行ってきましたこれらのケースには、データ/知的財産の盗難、ノンコンピート条項の施行、合併・買収における紛争などが含まれています

「ODSCウェストからの9つのセッション、私たちが話し続けているもの」

2週間前にODSC West 2023を締めくくりましたが、まだお気に入りのセッションや私たちを笑わせたり、気づきを与えてくれたスピーカーについて話題になっています以下には掲載しきれないほど、多くの魅力的なセッションがありましたが、ODSC Westのハイライトの一部をお楽しみくださいヒューマンセンタード...

統計力の解読：マーケティング研究における精度の鍵

この記事は「マーケティング効果の測定」シリーズの続きであり、前回のパートを見逃した場合は、ここで簡単に振り返ります帰無仮説（H0）は、仮説として定義されます...

データサイエンティストが知っておくべき10の必須パンダ機能

この記事には、データサイエンティストにとって重要で便利な10個のパンダの関数が含まれています

Data science

スタンフォード大学の研究者がRT-Sketchを紹介します：目標仕様としての手描きスケッチを通じた視覚模倣学習の向上

研究者は、手描きスケッチを視覚模倣学習における目標指定の未開拓の手法として紹介しました。これらのスケッチは、自然言語の曖昧さと画像の過度な具体性の両方のバランスを取ることで、ユーザーが迅速にタスク目的を伝えることを可能にします。彼らの研究では、手描きの望ましいシーンのスケッチを入力とし、対応するアクションを生成する目標条件付きの操作方針であるRT-Sketchを提案しています。ペアトラジェクトリと合成スケッチによる訓練を行ったRT-Sketchは、さまざまな操作タスクで堅牢なパフォーマンスを示し、不明瞭な目標や視覚的な邪魔物を持つシナリオで言語ベースのエージェントを凌駕しています。この研究では、自然言語や画像など従来の目標条件付き模倣学習の手法について詳しく調査し、これらの表現の限界を強調し、スケッチなどのより抽象的で精確な代替手法が必要であることを論じています。また、画像をスケッチに変換し、それらを目標ベースの模倣学習に統合するための進行中の研究にも言及しています。さらに、目標条件付き学習において言語や画像を目標とする先行研究を参照し、両者を組み合わせた多モーダルアプローチについても探究しています。デモンストレーションデータの終端画像に対する後知恵のあるラベリングにおける画像からスケッチへの変換の利用についても議論しています。この手法は、不正確な場合がある自然言語コマンドと、過度に詳細で一般化が困難な目標画像の欠点を指摘し、視覚模倣学習における目標指定の有望な代替手法として手描きスケッチを提案しています。これらのスケッチはユーザーフレンドリーであり、既存のポリシーアーキテクチャRT-Sketchに統合されています。この目標条件付きポリシーは、望ましいシーンの手描きスケッチを入力とし、対応するアクションを生成します。 RT-Sketchは、手描きシーンスケッチを入力とし、ペアトラジェクトリと合成目標スケッチのデータセットで訓練されます。元のRT-1ポリシーを修正し、FiLM言語トークン化を削除し、EfficientNetへの目標画像またはスケッチの連結を入力とします。訓練には行動クローニングを使用して、観測された行動とスケッチの目標を最小化します。画像からスケッチへの変換生成ネットワークは、RT-1データセットに目標スケッチを追加するために使用され、RT-Sketchの訓練に役立ちます。この研究では、フリーハンド、線画、カラー表現など、さまざまな詳細のスケッチの処理能力を評価しています。この研究は、単純なシナリオでは、RT-Sketchが画像や言語に基づくエージェントと比較して、競争力のあるパフォーマンスを示すことを示しました。手描きスケッチから目標を達成する能力は特に注目に値します。RT-Sketchは、不明瞭さや視覚的な干渉物といった問題に直面した場合に、言語ベースの目標に比べて高い堅牢性を示します。評価は、ピクセル間の距離を使用した空間的な精度の計測と、人間によるセマンティックおよび空間的な整合性の7段階リカートスケールを使用した評価を含みます。研究はその限界を認識しながらも、さまざまなユーザーのスケッチや場合による誤ったスキルの実行に対するRT-Sketchの汎用性をテストする必要性を強調しています。まとめると、手描きスケッチを利用した目標条件付きの操作方針であるRT-Sketchは、さまざまな操作タスクにおいて、確立された言語または目標画像ベースのポリシーと比較可能なパフォーマンスを示します。視覚的な干渉と目標の曖昧さに対する高い耐性を持っています。RT-Sketchの柔軟性は、単純な線画から複雑でカラフルな描写まで、さまざまな具体性のスケッチを理解する能力が示されています。将来の研究では、手描きイラストの有用性を拡大し、組み立てタスクにおいて図面やダイアグラムなどのより構造化された表現を包括する可能性があります。

データマイニングにおける連想ルールとは何ですか？

イントロダクション石炭採掘からデータマイニングへの人類の進化は、人間の成長と技術の発展に莫大な貢献を持っています。物理的な作業の範囲が変化し、この新しいタイプのマイニングを行うために重さは精神的な努力に移行しました。データマイニングプロセスには、顧客を理解しビジネスの成長に寄与する実用的な貢献がある連想ルールを含む多くの側面があります。正確な要件をお持ちですか？顧客満足度の指数的な向上をもたらすための知識の向上に興味がありますか？大手ブランドと競合するより優れた推薦システムを開発したいと考えていますか？ここでは、データマイニングにおける連想ルールの主要な概念と基本についての簡単な紹介があります。学習目標連想ルールの本質を理解し、データ内の関係を示すif/then文としての役割を把握する。市場バスケット分析、詐欺検出、および推薦システムなどのアプリケーションの特定と差別化を行い、連想ルールの汎用性と実用的な重要性を示す。カーディナリティ、サポート、信頼性、リフトといった要素がデータセット内の関係を予測・評価する際にどのように機能するかに洞察を得る。データマイニングにおける連想ルールとは何ですか？連想ルールは、名前によって定義され、データ間の関係や依存関係を特定するif/then文です。数値データや非数値データに適している特性を持ち、市場バスケット分析などのアプリケーションでよく使用されます。関連性のある情報をリレーショナルデータベースやトランザクションデータベース、他のデータソースから取り込むことができます。連想ルールは、前件（if）と結果（then）の2つの部分から成り立ちます。前件はデータで利用可能な最初の部分であり、結果は前件と組み合わせて利用可能な結果的な部分です。例えば、市場バスケット分析の場合、「顧客がランニングシューズを購入した場合、エナジーバーも購入する可能性が高い」となります。ここで、ランニングシューズが前件、エナジーバーが結果となります。この例は特にフィットネス愛好家の対象をターゲットにしています。連想ルールの利用事例とは何ですか？連想ルールにはさまざまな応用があります。トップ3の連想ルールマイニングの例は以下の通りです: 市場バスケット分析：購入組み合わせの例としては、ヨーグルトとグラノーラの購入がベリーの購入と関連している可能性が高いことが挙げられます。これは購買習慣や要件の分析における連想ルールの重要性を示しています。組み合わせオファーや商品配置の最適化、売上の増加など、実用的な解釈の利用が見られます。詐欺検出：ここでは、購入パターン、場所、頻度などの組み合わせを特定します。これによって不正行為を検知し、同じIPアドレスからの予防措置を取ることができます。推薦システム：これには、ブラウジング履歴や過去の購入から使用パターンを検知し、ユーザーの将来の要件を予測することが含まれます。推薦はそれに基づいて行われます。マーケティングからの利用拡大は、音楽や番組ベースのサービスでも重要です。出典: Dataaspirant 連想ルールはどのように機能しますか？先に説明した連想ルールの予測は、カーディナリティ、サポート、信頼性に基づいて計算されます。カーディナリティは2つのアイテムの関係を指し、オブジェクトの数に比例して増加します。サポートは文の頻度を示し、信頼性はこれらの関係の真実性の頻度を示します。連想ルールの機能を説明するには、組み合わせが発生する理由と状況を規定するルールを特定します。例えば、朝食の健康的で時間のかからないオプションとして、ヨーグルトにグラノーラとベリーを組み合わせることが好ましいとされています。実際の状況では、数字が非現実的になることがよくあります。統計的に独立したアイテムの中で最も購入の組み合わせが少ないものが、実際の使用では非常に高い割合で結合されることがあります。例えば、統計的にはビールとおむつの同時購入は起こりにくいですが、実世界の統計では比較的高いです。この統計の増加をリフトと呼んでいます。関連ルールの効果の測定関連ルールの効果は、主にサポート、信頼度、およびリフトによって測定されます。サポートは頻度を指し、高いサポートはデータセット内の数量の一般的な存在を示します。信頼度は関連ルールの信頼性を測定します。高い信頼度はAとBが比例しており、互いに直接関係が増加していることを示唆します。リフトはアイテムの依存性を比較します。統計的および実用的な数字が同じであるか、前件と後件が同じである場合、リフトは1になり、関連したオブジェクトは独立しています。リフトが1より大きく、前件が後件よりも大きい場合、オブジェクトは互いに依存します。また、リフトが1より小さい場合、後件が前件よりも多い場合、組み合わせは互いに否定的な影響を与えます。出典：データマイニングマップ関連ルールのアルゴリズム…

UCSDの研究者が、チューリングテストでのGPT-4のパフォーマンスを評価：人間のような欺瞞とコミュニケーション戦略のダイナミクスを明らかにする

GPT-4はUCSDの研究者グループによってインターネット上の一般的なチューリングテストで試験されました。最も優れたGPT-4のプロンプトは、ゲームの41％で成功しました。これはELIZA（27％）、GPT-3.5（14％）および無作為なチャンス（63％）によって提供されたベースラインよりも良い結果でしたが、まだ完全な性能ではありません。チューリングテストの結果によれば、参加者は主に言語スタイル（合計の35％）とソーシャル・エモーショナルな特性（合計の27％）で判断されました。参加者の教育レベルやLLM（Large Language Models）への事前の経験は、彼らが詐欺を見破る能力を予測するための要因ではありませんでした。これは、そのような問題に精通している人々であっても、トリックに対して脆弱である可能性があることを示しています。チューリングテストは知性の尺度としては広く批判を受けていますが、カリフォルニア大学サンディエゴ校の2人の研究者は、それが即興のコミュニケーションと詐欺の尺度として有用であると主張しています。彼らは人間と見なすことができる人工知能モデルを持っており、これには広範な社会的影響があるかもしれません。したがって、彼らは人間らしさを決定するためのさまざまな方法論と基準の効果を調査しています。チューリングテストは知性への感度に関する論争とは関係なく興味深いものです。まず、テストされている能力、つまりシステムが対話者を人間だと思わせることができるかどうかを分析することが重要です。チューリングテストは、そのような能力の開発をモデルで監視するための信頼性のある方法を提供します。さらに、モデルのサイズや性能、プロンプト戦略、リアルタイム情報へのアクセスなどの補助的なインフラストラクチャ、およびインタラクティブのレベルなど、嘘をつくことに関与するさまざまな側面についても学ぶことができます。また、チューリングテストは、機械が人間らしく見えるという一般的な認識を調査するための研究ツールとしても使用できます。機械のパフォーマンスが評価されますが、人間の参加者の文化的、倫理的、心理的な前提条件も調査されます。インタラクティブが質問を作成し、洗練された質問を行う過程で、インタラクターが人間であると考える属性に関する基本的な意見が明らかにされます。チューリングテストは、1人の尋問者と1人の証人によって変更され、証人が人間か人工知能かを判断します。これはチューリングの最初の3人の公式とは異なりますが、各ゲームに複数の人間参加者をオンラインで必要としないため、かなり一般的になりました。彼らはOpenAI APIを使用して、ユーザーからの質問に答えることができる25のLLM証人を開発しました。各LLM証人は温度設定（0.2、0.5、または1.0）、モデル（GPT-3.5またはGPT-4）、およびプロンプトを持っていました。報告書は状況を説明し、エージェントに具体的な指示を与えました。チャットアプリのユーザーインターフェースは、標準的なメッセージングサービスに似せて作られました。尋問者が最初のメッセージを送信し、各ユーザーは同時に1つのメッセージのみを送信することができました。各通信は最大300文字で、総討論時間は5分でした。テキストボックスに貼り付けることは制限され、侮辱的なメッセージを防止するためにコンテンツフィルタが適用されました。画面の右上隅にはカウントダウンタイマー、指示オーバーレイを表示するボタン、および侮辱的な人々を報告するためのフォームがあります。尋問者は意思決定インターフェースを使用して、以下の情報を提供しました： i）判決（機械または人間の証人） ii）正しい判断を下したことにどれだけ確信しているか（0〜100） iii）選択の理由（自由形式の言語）制約事項オープンでオンラインの実験としての性質上、この研究にはいくつかの欠点があり、その結果は確かとは言えません。まず、サンプルがコミュニティの代表的なものよりも反映されている可能性があります、なぜなら参加者はソーシャルメディアを通じて募集されたからです。また、参加者にはインセンティブが必要でした。したがって、尋問者や証人が最善を尽くした可能性があります。人間の証人は人工知能のように振る舞って「トローリング」しています。一部の調査員はこのような行為を人間の判決の正当化として使用しました。したがって、結果は人間のパフォーマンスを過小評価し、AIのパフォーマンスを過大評価している可能性があります。第三に、一部の尋問者は証人に関する事前知識を持っていたことを認めています。要約すると- チューリングテストは知能の不完全な指標としてしばしば非難されてきました。これは、あまりにも評価が明らかであったために、研究者が人間のパフォーマンスを過大評価した可能性があります。最後に、一度に1人のオンラインユーザーしかいなかったため、彼らは頻繁に同じ人工知能の証人とペアリングされました。その結果、人々は特定の証言がAIであるという固定観念を持つ可能性があり、全体的に低いSR結果につながる可能性があります。このバイアスは、1人の尋問者が3回以上連続してAIと対戦したゲームを削除することで対抗する努力があったにもかかわらず、結果に影響を与えたでしょう。最後に、利用可能なプロンプトの一部のみが使用され、それらは実際の人々がゲームとどのように対話するかを知らない状態で開発されました。結果は、より効果的なプロンプトが存在するため、チューリングテストでのGPT-4の潜在的なパフォーマンスを過小評価しています。

「どのテキストもコンセプトのグラフに変換する方法」

テキストコーパスから知識グラフ（コンセプトグラフ）をMistral 7Bを使用して作成する

DISC-FinLLMとは、複数の専門家のファインチューニングに基づいた中国の金融大規模言語モデル（LLM）です

“` 人工知能の分野で最大の進歩は、大規模言語モデル（LLM）の導入です。これらの自然言語処理（NLP）ベースのモデルは、大きく複雑なデータセットを処理するため、金融業界では独自の課題に直面しています。金融テキストの要約、株価予測、財務報告書の作成、ニュースの感情分析、金融イベントの抽出の分野では、従来の金融NLPモデルが進化しています。金融データの量と複雑さが増えるにつれて、LLMは人間によるラベル付けされたデータの不足、金融に特化した専門知識の不足、複数のタスクの難しさ、数値計算の制約、リアルタイム情報の扱いの難しさなど、多くの課題に直面しています。GPT-4などのLLMは、強力な対話能力、コマンドの理解力、指示に従う能力で有名です。ただし、中国の金融市場などの産業において、LLMは金融業界に対する深い理解が不足しており、さまざまなユーザータイプと状況設定に適したオープンソースの中国金融LLMの開発は重要です。この問題に対処するため、研究チームはDISC-FinLLMという包括的な中国金融LLMの作成方法を導入しました。この手法の主な目的は、LLMに金融テキストを生成・理解する能力を持たせ、金融問題についてのマルチターンの対話を行い、プラグイン機能を介して金融モデリングや知識強化システムを支援することです。研究チームは、DISC-FIN-SFTと呼ばれる教師付きの指示データセットも開発しました。このデータセットの主なカテゴリは以下の通りです。金融コンサルティングの指示：これらの指示はオンライン金融フォーラムや金融Q&Aデータセットから開発されました。金融に関する問い合わせに答えたり、ガイダンスを提供したりすることを目的としています。金融タスクの指示：これらの指示はさまざまな金融業務のサポートに役立ちます。自己構築および利用可能なNLPデータセットから抽出されています。金融計算の指示：これらの指示は金融統計や計算、モデリングの問題の解決策を扱っています。リトリーバル強化の指示：これらの指示は知識検索を容易にします。金融テキストから構築され、質問、参照情報、回答が生成されています。研究チームは、DISC-FIN-SFT指示データセットがDISC-FinLLMの構築の基礎であることを公開しています。このモデルは、Multiple Experts Fine-tuning Framework（MEFF）を使用して構築されたLow-rank adaptation（LoRA）モジュールを4つ使用してトレーニングされています。金融のマルチラウンド対話、金融NLPジョブ、金融計算、リトリーバルに関する質問応答など、これらのモジュールはさまざまな金融シナリオに対応できるように作られています。これにより、システムは学生、開発者、金融専門家などの関連するユーザーグループにさまざまなサービスを提供することができます。この特定のバージョンでは、DISC-FinLLMの基礎となるのは一般ドメインの中国語のLLMであるBaichuan-13Bです。研究者たちは、DISC-FinLLMの評価のために複数のアセスメントベンチマークを実施しています。実験結果は、DISC-FinLLMがすべての下流タスクで基礎モデルよりも優れたパフォーマンスを発揮することを示しています。MEFFアーキテクチャの利点によって、モデルがさまざまな金融シナリオやジョブで優れたパフォーマンスを発揮できるようになっています。 “`

コースを安定させる：LLMベースのアプリケーションの評価をナビゲートする

大型言語モデル（LLM）は話題になっており、多くの人々がそれを自分のアプリケーションに取り入れています関係データベース上の質問に答えるチャットボットやサポートするアシスタントなど...

Learn more about Search Results A - Page 554