Learn more about Search Results さまざまな要素 - Page 7
- You may be interested
- 「2023年に注目すべきトップ7のデジタルマ...
- UCバークレーの研究者たちは、目標指向型...
- 「Mini-DALLE3と出会おう:大規模な言語モ...
- 「生成AIのためのモダンなMLOpsプラットフ...
- ネットワークの強化:異常検知のためのML...
- 「Nemo-Guardrailsを自分のやり方で設定す...
- A/Bテストの意味を理解する:厳しい質問で...
- ReAct、Reasoning and Actingは、LLMをツ...
- 「DeepMindによるこのAI研究は、シンプル...
- 「Andrej Karpathy LLM Paper Reading Lis...
- 「機械学習におけるChatGPTコードインタプ...
- 「データサイエンティストが読むべきトッ...
- 「ChatGPTの新しいカスタム指示がリリース...
- 「LLMアプリを作成するための5つのツール」
- 「注目すべき8つのトレンディングで新しい...
データサイエンティストの役割の典型
最近の「Towards Data Science」への投稿が好評だったので、データに関する役割の実際のカテゴリについて少し書いてみようと思いました
データサイエンスは変わった、死んだわけではありません!
「データサイエンスはまだ必要ですか、それともChatGPTのようなツールがほとんどのタスクを引き継いでいますか?」
「ウェブマップを使用した空間データの表示」
地図を作る方法はたくさんありますQGISやArcGISなどのデスクトップGISソフトウェア、LeafletやMapbox GL JSなどのウェブフレームワーク、またはインクと紙を使って昔ながらの方法で作ることもできますウェブ...
マルチアームバンディットを用いた動的価格設定:実践による学習
意思決定の問題の広大な世界において、一つのジレンマが特に強化学習の戦略によって所有されています:探索と活用スロットマシンが並ぶカジノに入っていると想像してください...
「探索的データ分析の改善のための実践的なヒント」
探索的データ分析(EDA)は、機械学習モデルを使用する前に必要なステップですEDAプロセスでは、データアナリストとデータサイエンティストにとって集中力と忍耐力が必要です:事前に…
「LLMアプリケーションを構築する際に知っておくべき5つのこと」
LLMベースのアプリケーションを構築する際には、5つの問題が生じます
大規模言語モデルは、テキスト評価のタスクで人間を置き換えることができるのか? このAI論文では、テキストの品質を評価するためにLLMを使用し、人間の評価の代替手段として提案しています
I had trouble accessing your link so I’m going to try to continue without it. 以下のHTMLを日本語に翻訳します(HTMLコードは結果に含めます): 自然言語処理モデルとテキスト品質を示すアルゴリズムのパフォーマンスを評価するために、人間の評価が使用されてきました。しかし、人間の評価は一貫しているわけではなく、再現性がない場合もあります。同じ人間の評価者を募集し、評価基準の主観性や解釈の違いを含むさまざまな要素(評価基準の解釈など)により、同じ評価を返すことは困難です。 台湾国立大学の研究者は、この再現性の問題に対処するために、「大規模言語モデル」(人間の言語をモデル化するために訓練されたモデル)の使用を研究しました。彼らは、人間の評価と同じ指示、評価対象のサンプル、および質問を大規模言語モデルに提示し、それらの質問に対する応答を大規模言語モデルに生成させました。彼らは、オープンエンドのストーリー生成と敵対的攻撃という2つの自然言語処理タスクで、人間と大規模言語モデルの評価を使用してテキストを評価しました。 「オープンエンドのストーリー生成」では、人間と生成モデル(GPT-2)によって生成されたストーリーの品質を、大規模言語モデルと人間が評価することで検証しました。 そのために、評価指示、生成されたストーリーの断片、および評価質問に基づいて、それぞれ文法の正確さ、一貫性、好み、関連性の4つの属性に基づいてリケルト尺度(5段階)で評価されるアンケートを作成しました。 人間の評価では、ユーザーは準備されたアンケートに回答します。大規模言語モデルによる評価では、アンケートをプロンプトとして入力し、大規模言語モデルから出力を取得します。研究者は、T0、text-curie-001、text-davinci-003、ChatGPTという4つの大規模言語モデルを使用しました。人間の評価には、有名な英語教師を使用しました。これらの大規模言語モデルと英語教師は、人間が書いたストーリーとGPT-2が生成したストーリーをそれぞれ200件評価しました。英語教師による評価では、人間が書いたストーリーに対して4つの属性(文法的正確さ、結束性、好み、関連性)のすべてにおいて好意的な評価が示されました。これは、英語教師が生成モデルによって書かれたストーリーと人間によって書かれたストーリーの品質の違いを区別できることを示しています。しかし、T0とtext-curie-001は人間が書いたストーリーに明確な優位性を示しません。これは、大規模言語モデルがオープンエンドのストーリー生成を評価する際には、人間の専門家よりも能力が低いことを示しています。一方、text-davinci-003は人間が書いたストーリーと英語教師に明確な優位性を示しました。さらに、ChatGPTも人間が書いたストーリーに高い評価を示しました。 彼らは、AIの文を分類する能力をテストする敵対的攻撃のタスクを調査しました。彼らは、文をいくつかの敵対的攻撃(文をわずかに変更するための同義語の使用)で分類する能力をテストしました。そして、攻撃がAIの文の分類能力にどのように影響を与えるかを評価しました。これは、大規模言語モデル(ChatGPT)と人間を使用して行いました。 敵対的攻撃に対して、英語教師(人間の評価)は、敵対的攻撃によって生成された文を流暢さと意味の保存の点で元の文よりも低く評価しました。さらに、ChatGPTは敵対的攻撃の文に対して高い評価を与えました。また、ChatGPTは敵対的攻撃の文を元の文よりも低く評価しました。全体的に、大規模言語モデルは敵対的攻撃の文と元の文の品質を人間と同じように評価しました。 研究者は、大規模言語モデルによる評価の以下の4つの利点を指摘しています:再現性、独立性、コスト効率と速度、および不適切なコンテンツへの露出の低減。ただし、大規模言語モデルは事実の誤解釈にも影響を受けやすく、学習方法にはバイアスが導入される可能性があります。さらに、これらのモデルには感情がないため、感情を含むタスクの評価において効果が制限される可能性があります。人間の評価と大規模言語モデルによる評価は、それぞれ独自の強みと弱点を持っています。最適な効果は、人間とこれらの大規模モデルの組み合わせによって達成される可能性があります。
「GPT-5がOpenAIによって商標登録されました:それがChatGPTの未来について何を示しているのでしょうか?」
「GPT-5とは何ですか?また、OpenAIがなぜそれに商標を取得したのでしょうか?人工一般知能(AGI)に向けた次のステップとなる可能性のあるマルチモーダルAIについて調べてみましょうこの記事を読んで、GPT-5およびその商標の潜在的な機能、課題、および影響について詳しく知りましょう」
データオブザーバビリティの先駆け:データ、コード、インフラストラクチャ、AI
2019年にデータの可観測性カテゴリを立ち上げた時、その用語はほとんど発音できなかったものでした四年後、このカテゴリは現代の中核層として確立されました...
一貫性のあるAIビデオエディターが登場しました:TokenFlowは、一貫性のあるビデオ編集のために拡散特徴を使用するAIモデルです
拡散モデルは、この時点でお馴染みのものです。過去の1年間、AIの領域で鍵となるトピックでした。これらのモデルは、画像生成において驚くべき成功を収め、まったく新しいページを開きました。 私たちは、テキストから画像を生成する時代にいますし、それらは日々改善されています。MidJourneyなどの拡散型生成モデルは、大規模な画像テキストデータセットを使用しており、テキストの提示に基づいて多様で現実的な視覚コンテンツを生成する能力を示しています。 テキストから画像へのモデルの急速な進化は、画像編集とコンテンツ生成の著しい進展をもたらしました。現在、ユーザーは生成された画像と実際の画像のさまざまな要素を制御することができます。これにより、アイデアをよりよく表現し、手作業の描画に数日間費やす代わりに、比較的迅速な方法で結果を示すことができます。 ただし、これらの画期的な進展をビデオの領域に適用する場合は、状況は異なります。ここでは進展が比較的遅いです。テキストからビデオを生成する大規模な生成モデルは登場しましたが、解像度、ビデオの長さ、および表現できるビデオのダイナミクスの複雑さに関してはまだ制限があります。 ビデオ編集に画像拡散モデルを使用する際の主な課題の1つは、編集されたコンテンツがすべてのビデオフレームで一貫していることを確保することです。画像拡散モデルに基づく既存のビデオ編集方法は、自己注意モジュールを複数のフレームに拡張することでグローバルな外観の整合性を実現していますが、望ましいレベルの時間的一貫性を達成するのは難しいことがよくあります。これにより、プロフェッショナルや準プロフェッショナルは、追加の手作業を含む緻密なビデオ編集手順に頼ることがあります。 それでは、TokenFlowに会いましょう。これは、事前学習されたテキストから画像へのモデルの力を活用して、自然なビデオのテキストによる編集を可能にするAIモデルです。 TokenFlowの主な目標は、入力テキストプロンプトで表現される目標の編集に従って、元のビデオの空間レイアウトとモーションを維持しながら、高品質のビデオを生成することです。 TokenFlowはテキストプロンプトを使用して自然なビデオを編集できます。出典:https://arxiv.org/pdf/2307.10373.pdf TokenFlowは、時間の一貫性の解決を目指して導入されました。それは編集されたビデオの特徴がフレーム間で一貫していることを保証するために、元のビデオのダイナミクスに基づいて編集された拡散特徴を伝播させることによって実現されます。これにより、追加のトレーニングや微調整の必要なしに、最先端の画像拡散モデルの生成事前知識を活用することができます。TokenFlowは、既存の拡散型画像編集手法ともシームレスに連携します。
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.