Learn more about Search Results A - Page 531

スキーラーンチュートリアル:モジュール1

「Pythonの科学的なスタック(NumPy、Matplotlib、SciPy、Pandas、Seaborn)と数年間遊んだ後、次のステップがscikit-learnまたは「sklearn」だということが明らかになりましたMLの中でも最も人気のあるフレームワークの1つであり、機械学習の様々なテクニックとアルゴリズムを提供します...」

エコジェンに会ってください:生物学者や生態学者のためにリアルな鳥の歌を生成するために設計された新しいディープラーニングのアプローチ

ディープラーニングの登場は、さまざまな分野に大きな影響を与え、さまざまな領域にその影響を広げています。注目すべき応用の1つは、鳥の歌声を通じた希少鳥の監視です。 鳥の歌声による鳥の区別は、生態学者や一般の人々にとって数多くのモバイルアプリケーションやソフトウェアの利用可能性により、より容易になりました。しかし、識別ソフトウェアが馴染みのない鳥の種や参考録音が少ない鳥の種に遭遇した場合、大きな問題が発生します。 生態学者や保全家は、世界で最も希少な鳥の監視に直面しています。カナダのモンクトン大学の研究者は、この問題を克服するために、ECOGENというものを開発しました。ECOGENは、希少な種のサンプルを強化するために、生物学的な観点から鳥の真似を生成することができます。これらのサンプルは、生態学的なモニタリングで使用される音声識別ツールのトレーニングに使用できます。 音声の生成には、合成に必要な多数のサンプルが含まれるといういくつかの課題があります。さまざまな形式がオーディオファイルの処理に使用され、これらの表現の多くは情報の喪失を引き起こすため、高品質なオーディオサンプルの作成が困難になります。時間領域で音圧振幅を記録する波形表現は、情報の完全性を保ちながら最も普及している形式の1つとして浮かび上がります。 このため、ECOGENは、AIモデルの改善のために新しい鳥の音声のインスタンスを作成しました。基本的に、ECOGENは、動物に害を与えず、追加の現地調査を必要とせずに、野生録音が限られている種の音声ライブラリを拡張することができます。 研究者たちは、ECOGENによって生成された合成鳥の歌声のサンプルを鳥の歌声識別子に追加することで、鳥の歌声の分類精度が平均で12%向上することを発見しました。主任研究者の一人であるニコラス・ルコント博士は、生物多様性の変化を追跡するための音響モニタリングなどの自動化されたツールの緊急性を強調しました。ただし、音響モニタリングで種の識別に使用される現在のAIモデルには十分な参照ライブラリが頻繁に欠けていると指摘しました。 研究者たちは、合成鳥の歌声の作成が絶滅危惧種の保護に貢献し、彼らの発声、行動、および生息地の好みに関する貴重な情報を提供することができると強調しました。 ルコント博士は、このツールは他の種類の動物にも利益をもたらす可能性があり、鳥について開発されたECOGENでも哺乳類、魚類、昆虫、両生類に適用できると述べました。 ECOGENは、鳥の歌声の録音をスペクトログラムに変換し、音の視覚的な表現にします。次に、これらのスペクトログラムに基づいて新しいAIイメージを生成し、限られた録音を持つ種に特化したデータセットを強化します。これらの新しく生成されたスペクトログラムは、鳥の音声識別モデルのトレーニングのためにオーディオ形式に再変換されます。この研究では、全世界から収集された23,784の野生鳥の録音データセットを使用し、264種類の異なる種を包括しています。

デジタルツインは現代の物流を革命化しますこうすればどうなるか

「デジタルツインは物理的な世界と仮想的な世界をつなげることで、物流を変革し、効率性を向上させ、無駄を削減し、そして産業をインダストリー5.0に向けて準備しますこの記事でその利点を探ってみてください」

「モノのインターネット:進化と例」

「モノのインターネット(IoT)は単なる流行語ではなく、過去数十年間にわたって世界を変革してきた画期的な技術です」

「スタンフォード大学の研究者が言語モデルの事実性において革新を成し遂げました:自動的な優先順位付けとNLPの進歩によるエラー削減」

スタンフォード大学とUNCチャペルヒルの研究者は、LLMsが生成する事実に反する主張である幻覚として知られる問題に取り組んでいます。人間のラベリングなしで、研究者はLLMsを微調整してオープンエンドの生成環境で事実の正確性を向上させました。NLPの最近のイノベーションを活用して、外部知識ベースとの整合性を通じて事実性を評価し、直接の好み最適化アルゴリズムを用いて微調整を行っています。このアプローチにより、Llama-2で事実性が大幅に向上し、7Bの尺度での伝記や医学的質問応答の事実エラーレートが大幅に低下しました。 プロンプト、内部表現の摂動、および検索ベースの手法など、言語モデル内の事実エラーを緩和するためのさまざまな戦略が存在します。特にモデルのサイズが増大するにつれて、対立解決と事実性の維持に課題があります。FactScoreの変種は、推論時間の複雑さに対処するためにトレーニング中に検索を採用しています。好みに基づく学習を通じて微調整を行うことで、正しくない事実を効果的に減らすことができます。この研究では、言語モデルの不確実性を利用して真実性を推定するためのリファレンスフリーメソッドを導入しています。自動構築された好みペアからの事実性の学習は、人間の介入なしに潜在的な改善の可能性を示す、費用対効果の高いアプローチとして注目されています。 オープンエンドの生成環境に焦点を当て、人間のラベリングなしで言語モデルの事実性を向上させるための微調整を提案しています。外部知識ベースとの整合性を通じて事実性を判断し、直接の好み最適化アルゴリズムを利用するなど、NLPの最近のイノベーションを活用しています。このアプローチでは、自動生成された事実性の好み順位から学習を行い、ベンチマークデータセット上の他の戦略と比較して、伝記の生成や医学的質問への回答の事実エラーレートが大幅に低下します。 現在の研究では、外部知識ベースやモデルの信頼スコアとの整合性を通じて事実性を判断しています。直接の好み最適化アルゴリズムを用いて微調整を行い、教師付き模倣を超えた目標に焦点を当てています。既存の検索システムまたは新しい検索フリーのアプローチを通じて自動生成された事実性の好み順位から学習を行うことを提案しています。FactScoreなどの自動評価指標、人間の評価者、および推論時間の介入や層ごとのデコーディングとの比較を含めた評価が行われます。 このアプローチは、自動生成された事実性の好み順位からの学習が言語モデルの事実性の向上において効果的であることを示しています。微調整されたLlama-2モデルは、伝記の事実エラーレートを58%、医学的な質問に対する事実エラーレートを40%削減しました。人間の評価者は、FactTune-FSモデルをSFTモデルよりもかなり高く評価しています。GPT-4の評価とFactScoreの評価は高い相関関係を示し、FactTune-FSが事実エラーを減らすことに成功していることを示しています。 提案された研究では、長文生成を重視しながら言語モデルの事実性を向上させるための効果的な戦略が示されています。外部知識を使用したリファレンスベースの真実性の推定と、モデルの不確実性を利用したリファレンスフリーの推定の2つのアプローチが探究されています。いずれの方法でも、言語モデルの微調整により正しくない事実を一貫して減らすことができます。リファレンスコーパスのゴールドが必要ではない事実性の改善のためのスケーラブルな自己監督戦略を提供するリファレンスフリーのアプローチにより、実験結果は将来の研究の有望な方向を示しており、複数の事実性チューニング方法の組み合わせや大規模なモデルへのアプローチのスケーリングの探求が提案されています。 将来の研究では、事実性のチューニングと既存の手法の組み合わせ、例えば事実性チューニングDOLA実験の組み合わせを探求することを推奨しています。事実性の向上のために事実性をブーストするデコーディング技術と事実性チューニング手順を組み合わせることの効果を評価することが提案されています。事実性のチューニングと推論時間の介入などの異なるアプローチを組み合わせることの効果を評価することで、補完的なメカニズムについての示唆が得られるでしょう。原子的な事実を抽出するためのよりシンプルなアプローチや、GPT-4などの大規模なモデルへの事実性チューニングのアプローチを拡大することに向けた調査が提案され、さらなる探求が求められています。

センスタイムリサーチは、長文から人間の動きと軌跡を生成するための新しい人工知能アプローチ「Story-to-Motion」を提案しています

人工知能はほとんどの産業に進出しています。ストーリーから自然な人間の動きを作り出すことは、アニメーション、ビデオゲーム、映画の産業を完全に変革する力を持っています。最も困難なタスクの一つは、キャラクターが異なるエリアを移動し、特定のアクションを行う必要がある場合のストーリーからモーションへの変換です。詳細な説明を基に、このタスクは高レベルのモーションセマンティック制御と軌跡を扱う低レベル制御のスムーズな統合を必要とします。 テキストからモーションやキャラクターコントロールに多くの努力が注がれてきましたが、適切な解決策はまだ見つかっていません。既存のキャラクターコントロール手法には多くの制約があり、テキストの説明に対応することができません。現在のテキストからモーション手法でも、より多くの位置制約が必要であり、不安定なモーションが生成される結果となります。 これらの課題を克服するために、研究者のチームが独自のアプローチを導入しました。このアプローチは、入力テキストに合わせて制御されたトラジェクトリと連続的かつ無限に長いモーションを生成するのに非常に効果的です。提案されたアプローチには以下の3つの主要なコンポーネントがあります。 テキストによるモーションスケジューリング:現代の大規模な自然言語モデルは、長いテキストの説明からテキストによるモーションスケジューラとして、テキスト、位置、期間のペアを取ります。この段階では、生成されるモーションがストーリーに基づいており、各アクションの位置と長さについての詳細も含まれます。 テキストによるモーションリトリーバルシステム:モーションのマッチングと制約によってトラジェクトリとセマンティックの組み合わせで総合的なモーションリトリーバルシステムを作成しました。これにより、生成されるモーションがテキストの説明に沿ったセマンティックと位置の特性を満たすことが保証されます。 プログレッシブマスクトランスフォーマ:フットスライディングや異常な姿勢といった遷移モーションの頻繁なアーティファクトに対処するために、プログレッシブマスクトランスフォーマが設計されました。この要素は、生成されるモーションの品質を向上させ、スムーズなトランジションとより現実的な外観を持つアニメーションを生成する上で不可欠です。 チームは、このアプローチをモーションのブレンディング、時間的なアクションの合成、軌跡の追跡という3つの異なるサブタスクでテストしたと共有しています。評価の結果、これまでのモーション合成技術と比較して、すべての領域で性能が向上したことが示されました。研究者は、主な貢献を以下のようにまとめています。 詳細なテキストの説明から包括的なモーションを生成するために、軌跡とセマンティクスが導入され、ストーリーからモーションへの問題が解決されました。 正確かつカスタマイズ可能なモーション合成を提供するために、広範なテキスト入力を使用する新しい方法であるテキストベースのモーションマッチングが提案されました。 ベンチマークデータセットで実施された実験によって示されるように、軌跡の追跡、時間的なアクションの合成、モーションのブレンディングのサブタスクで、このアプローチは最先端の技術を凌駕しています。 まとめると、このシステムはテキストナラティブからの人間のモーション合成において、大きな進歩です。ストーリーからモーションの問題に関連する課題に完全な解答を提供します。アニメーション、ゲーム、映画の業界に革新的な影響を与えることでしょう。

チャットボットは何と言うのか?

「大規模言語モデルの予想外の能力を説明することを目指しています」

「韓国が自律型ロボットに歩道の利用を許可」

「韓国政府は、認可された自律ロボットを国の歩道を走らせることを許可しています」

「修正策にもかかわらず、ハッカーたちがシトリックスソフトウェアの欠陥を悪用しています」

「Citrix Bleed」というCitrix Systemsソフトウェアの重大な欠陥は、政府支援のハッカーや重要なグループによって悪用されています

『アポロ8が月レースを制した方法』

この12月で55年前、アポロ8号のクルーは地球の影響圏を離れ、他の天体へ旅する最初の人間となりました今月、フランク・ボーマンは…

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us