Learn more about Search Results Meg - Page 4

ICAと現実のカクテルパーティの問題

「独立成分分析(ICA)は、1990年代以降の重要な発展¹以降、一般的に使用されるようになったデータ分解および前処理技術ですICAは、盲目的なソース...」

『冬-8Bに出会ってください:冴えたプラットフォームの背後にある非常にユニークなファンデーションモデル』

Adept.aiは、新たに誕生したAIのユニコーンの一部ですアイコニックなトランスフォーマーペーパーの著者たちによって最初に育成され、Adeptは自律型AIエージェントの領域で活動していますそのため、…

予めトレーニングされた基礎モデルは、分子機械学習の未来ですか?前例のないデータセットとGraphium機械学習ライブラリを紹介します

最近の薬剤探索における機械学習の最新の成果は、主にグラフおよび幾何学的ディープラーニングモデルに帰因されています。これらの技術は、原子間相互作用のモデリング、分子表現学習、3Dおよび4Dシチュエーション、活性および特性予測、力場の作成、分子の生成において効果を発揮しています。他のディープラーニング技術と同様に、優れたモデリング精度を提供するためには、多くのトレーニングデータが必要です。しかし、現在の治療に関する文献のほとんどのトレーニングデータセットは、サンプルサイズが小さいです。驚くべきことに、最近の自己教師あり学習、コンピュータビジョンおよび自然言語処理のための基礎モデル、および深い理解の発展により、データの効率性が大幅に向上しました。 実際には、巨大なデータセットを使用して前処理において大量のデータを使用することで、リソースを一度費やすことで、ダウンストリームタスクにおけるデータの必要性を減らす学習済みの帰納的バイアスが示されています。これらの成果の後、他の研究では、少量のデータで分子モデリングを行うために大規模な分子グラフニューラルネットワークの事前学習の利点を検証しました。大きなラベル付き分子データセットの不足のため、これらの調査では対照的な学習、オートエンコーダ、またはノイズ除去タスクのような自己教師ありアプローチのみを使用することができました。これらのモデルからのファインチューニングによるNLPとCVの自己教師ありモデルの改善の一部しか、低データモデリングの試みではまだ生み出されていません。 分子およびそのコンフォマーの挙動は環境に依存し、主に量子物理学によって制御されるため、分子およびそのコンフォマーに対するグラフモデリングの不正確さは一部説明されます。例えば、構造が似ている分子でも、生物活性のレベルは大きく異なることが広く知られており、これをアクティビティクリフと呼ぶ現象がグラフモデリングのみに基づくことを制約しています。彼らの主張によれば、分子モデリングの効率的なベースモデルを開発するには、量子力学的記述と生物環境に依存したデータから導かれた情報を使用した教師ありトレーニングが必要です。 Québec AI Institute、Valence Labs、Université de Montréal、McGill University、Graphcore、New Jersey Institute of Technology、RWTH Aachen University、HEC Montréの研究者らは、分子研究に3つの貢献をしています。まず、現行技術よりも桁違いに大きなマルチタスクデータセットの新しいファミリーを提案します。次に、巨大データセットで効果的なトレーニングを可能にするグラフ機械学習パッケージであるGraphiumを紹介します。第3に、複数のタスクでのトレーニングの利益を示すさまざまなベースラインモデルを提供します。彼らは現在最大のものとして、約1億の分子と3000以上のスパースに定義されたアクティビティを持つ、3つの包括的かつ厳格に維持されたマルチラベルデータセットを提供します。これらのデータセットは、シミュレーションやウェットラボテストを通じて学習された量子および生物学的な特徴を記述するラベルを組み合わせており、基礎モデルの教師ありトレーニングに使用されます。ラベルがカバーする責任は、ノードレベルとグラフレベルの両方に及びます。 さまざまなラベルの存在は、効果的に転移スキルを獲得するのを容易にします。さまざまな下流分子モデリング活動のモデルの一般化を高めることで、基礎モデルを構築することが可能になります。彼らは既存のデータに対して細心の注意を払い、新しい情報を追加してこれらの広範なデータベースを作成しました。その結果、彼らのコレクションの各分子の記述には、量子力学的な特性と生物学的な機能に関する情報が含まれています。QM特性のエネルギー、電気、および幾何学的成分は、PM6などの半経験的な手法やB3LYPなどの密度汎関数理論に基づく手法など、さまざまな先端技術を使用して計算されます。図1に示すように、生物活性に関する彼らのデータベースには、毒性プロファイリング、遺伝子発現プロファイリング、および投与量応答生物試験からの分子シグネチャが含まれています。 図1:提案された分子データセットコレクションのビジュアル概要。“ミックス”は複数のタスクを同時に予想するために設計されています。それらはグラフレベルおよびノードレベルのジョブ、量子、化学、生物学の側面、カテゴリおよび連続データポイントを含んでいます。 量子効果と生物学的効果の同時モデリングにより、しばしば小規模な実験データセットからは得られない、複雑な環境依存的特性を分子の特徴づける能力が向上します。 Graphiumのグラフ機械学習ツールキットであるグラフィウムライブラリは、これらの巨大なマルチタスクデータセットでの効果的なトレーニングを可能にするために作成されました。この革新的なライブラリは、特徴アンサンブルと複雑な特徴の相互作用を含む分子グラフの基礎モデルの作成とトレーニングを簡素化します。 Graphiumは、以前の逐次的なサンプルに対して主に意味がないノード、エッジ、およびグラフの特性間の相互作用を考慮して、特徴と表現を基本的な構成要素と見なし、最先端のGNNレイヤーを追加することで、以前のフレームワークの制約に対処します。 さらに、グラフィウムは、データセットの組み合わせ、欠損データの処理、および共同トレーニングなどの機能を提供することで、大規模なデータセットアンサンブルでのモデルのトレーニングを簡単かつ高度に設定できるように処理します。提供されるデータセットの混合物について、彼らは単一データセットとマルチデータセットのシナリオでさまざまなモデルをトレーニングします。これらは信頼性のあるベースラインを提供し、これらのデータセットの今後のユーザーにとっての参考点となり、このマルチデータセットの方法論を使用してトレーニングする利点についてのいくつかの示唆を提供します。 結論として、この研究は最大の2D分子データセットを提供します。これらのデータセットは、分子の量子特性と生物学的柔軟性を正確に理解し、さまざまな下流アプリケーションに合わせるための基礎モデルをトレーニングするために明示的に作成されました。さらに、これらのモデルのトレーニングを簡素化し、使用されるデータセットとライブラリの潜在能力を示す異なるベースラインの結果を提供するために、グラフィウムライブラリを作成しました。

メタ AI 研究者たちは、非侵襲的な脳記録から音声知覚のデコーディングを探求するための機械学習モデルを紹介します

脳活動からの音声の解読は、医療や神経科学の分野で長い間の目標であり、侵襲的な装置を用いた研究によって最近進展しています。侵襲的な録音に基づいて訓練された深層学習アルゴリズムは、基本的な言語要素を解読することができます。しかし、これを自然な音声や非侵襲的な脳活動の録音にまで拡張することは困難です。Metaの研究者は、自然な音声を非侵襲的な録音から解読するために対照的学習を用いた機械学習モデルを紹介しています。彼らの手法は4つのデータセットを組み合わせ、有望な結果を達成し、侵襲的な手順なしで脳活動からの言語解読の可能性を提供しています。これには医療や神経科学への影響があります。 研究者は、侵襲的な装置による言語要素の解析の成功を基に、非侵襲的な脳活動の録音から音声を解読することを探究しています。その手法は、自己教師あり音声表現の解読に対して対照的学習モデルを紹介しています。侵襲的な研究との比較によって彼らの方法はより広範な語彙を示し、音声制作への応用の可能性についても議論されています。健康な成人ボランティアのデータセットについて倫理的承認が得られています。 非侵襲的な脳活動の録音からの音声の解読は、医療や神経科学において重要な課題です。侵襲的な装置が進展している一方で、自然な音声にまで拡張することは困難です。彼らの手法は、非侵襲的なデータから自己教師あり音声表現を解読するための対照的学習モデルを紹介しています。彼らの進歩は、侵襲的な手続きなしで脳活動からの言語解読の可能性を示しています。 彼らの手法は、非侵襲的な脳活動の録音から知覚された音声を解読するためのニューラルデコーディングタスクを紹介しています。このモデルは、MEGまたはEEGで物語を聞きながら記録された175人のボランティアからのデータを使用して訓練および評価されています。一般的な畳み込みアーキテクチャを使用し、複数の参加者に対して同時に訓練されています。基準との比較は、対照的な目的および事前訓練された音声表現の重要性を強調しています。また、デコーダーの予測は主に語彙的および文脈的な意味表現に依存しています。 解読の精度は参加者やデータセットによって異なります。単語レベルの予測では、正しい単語の識別と負の候補からの識別が正確であることが示されました。基準との比較により、対照的な目的、事前訓練された音声表現、共有畳み込みアーキテクチャの重要性が強調され、解読の精度が向上しています。デコーダーの予測は主に語彙的および文脈的な意味表現に依存しています。 研究者は、非侵襲的な脳活動の録音から知覚された音声を解読するための対照的学習モデルを紹介しています。彼らのモデルは、音声セグメントの識別において平均精度が最大41%、最も優れた参加者において最大80%の精度を達成し、有望な結果を示しています。基準との比較により、対照的な目的、事前訓練された音声表現、共有畳み込みアーキテクチャの重要性が強調されています。デコーダーの予測は主に語彙的および文脈的な意味表現に依存しています。彼らの研究は、医療や神経科学の応用における非侵襲的な言語解読の可能性を持っています。 今後の研究では、参加者やデータセットにおける解読の精度のばらつきに寄与する要因を明らかにする必要があります。より複雑な言語属性やリアルタイムの音声認識シナリオを解決するためのモデルのパフォーマンスを調査することが不可欠です。さまざまな脳活動の録音または画像化技術へのモデルの汎用性を評価することも重要です。韻律や音声学的な特徴を捉える能力を探究することにより、音声解読について包括的な理解を提供することができます。

「大規模言語モデルの読み込みについての紹介」

AI ジャイアントの時代において、テラバイトのデータと数十億のパラメータで訓練されたモデルが統治する中、自然言語処理の領域はよりアクセスしやすくなっています-...

バイトダンスとキング・アブドゥッラー科学技術大学のAI研究者が、静止したポートレート写真の髪の毛を揺らすための新しいフレームワークを発表します

髪は人間の身体の中でも最も印象的な特徴の1つであり、そのダイナミックな特性によってシーンが生き生きと表現されます。研究により、ダイナミックな要素が静止画像よりも強い魅力と興味を引き起こすことが一貫して証明されています。TikTokやInstagramのようなソーシャルメディアプラットフォームでは、人々が写真を魅力的で芸術的に魅力的にすることを望んで、広範なポートレート写真の共有が日常的に行われています。この動機は、静止画像内の人間の髪をアニメーション化する領域の探索を燃料としており、鮮やかで美しく景観的な視覚体験を提供することを目指しています。 この分野での最新の進化により、静止画像に水、煙、火などの流動物質をアニメーション化する手法が導入されました。しかし、これらの手法は実生活の写真での人間の髪の複雑な性質をほとんど無視しています。この記事では、ポートレート写真内で人間の髪の芸術的な変換に焦点を当て、その写真をシネマグラフに変換することを目指しています。 シネマグラフは、プロの写真家、広告主、アーティストの間で好まれる革新的な短いビデオ形式です。デジタル広告、ソーシャルメディア投稿、ランディングページなど、さまざまなデジタルVoAGIで利用価値があります。シネマグラフの魅力は、静止画像と動画の強みを融合させる能力にあります。シネマグラフの一部分には、短いループで繰り返し動作する微妙な動きがあり、残りの部分は静止しています。この静止と動きの要素の対比が、鑑賞者の注意を効果的に引きつけます。 ポートレート写真をシネマグラフに変換することで、微妙な髪の動きを含めて、写真の魅力を高めることを目指しています。これにより、より魅力的で魅力的な視覚体験が生まれます。 既存の手法や商用ソフトウェアは、入力ビデオから高品質なシネマグラフを生成するために、一部のビデオ領域を選択的に凍結するという手法を採用しています。残念ながら、これらのツールは静止画像の処理には適していません。対照的に、静止画像のアニメーション化に関心が高まっています。これらの手法の多くは、雲や水、煙などの流体要素をアニメーション化することに焦点を当ててきました。しかし、繊維状の材料から構成される髪のダイナミックな振る舞いは、流体要素と比較して独特の課題を提供します。広範な注目を集めている流体要素のアニメーション化とは異なり、実際のポートレート写真での人間の髪のアニメーション化は比較的未開拓の領域です。 静止したポートレート写真で髪をアニメーション化することは、髪の構造とダイナミクスの複雑さにより、困難を伴います。人間の体や顔の滑らかな表面とは異なり、髪は数十万もの個別のコンポーネントから構成され、複雑で均一ではありません。この複雑さにより、髪内には髪の中での複雑な運動パターンや頭との相互作用が存在します。カメラアレイと高速カメラを使用するなど、髪のモデリングのための特殊な手法はありますが、コストと時間がかかるため、実世界での髪のアニメーションには制約があります。 本記事で紹介する論文は、静止したポートレート写真内で髪を自動的にアニメーション化するためのAI手法を紹介しており、ユーザーの介入や複雑なハードウェアセットアップは不要です。この手法の背後にある考えは、実際のポートレートビデオ内の個々の髪のストランドとそれらの動きに対する人間の視覚システムの感度が、仮想環境内の合成ストランドと比較して低下していることです。提案されている解決策は、個々のストランドではなく「髪の房」をアニメーション化することで、視覚的に魅力的な視聴体験を創造することです。これを実現するために、本論文では髪の房のアニメーションモジュールを紹介し、効率的かつ自動化された解決策を提供しています。以下に、このフレームワークの概要を示します。 この文脈での主な課題は、これらの髪の房をどのように抽出するかです。髪のモデリングなどの関連する研究では、主に髪の領域全体の抽出を対象としていますが、これは目的と異なります。意味のある髪の房を抽出するために、研究者は髪の房抽出をインスタンスセグメンテーション問題としてフレーム化し、静止画像内の個々のセグメントが髪の房に対応するようにしました。この問題定義を採用することで、研究者はインスタンスセグメンテーションネットワークを活用して髪の房の抽出を容易にしました。これにより、髪の房の抽出問題が簡素化されるだけでなく、効果的な抽出のために高度なネットワークの使用が可能になります。さらに、本論文では、ネットワークのトレーニングのための実際のポートレート写真を含む髪の房データセットの作成と、特定された髪の房のための正解注釈のためのセミアノテーションスキームの作成を紹介しています。以下の図には、本論文と先進的な手法を比較したいくつかのサンプル結果が報告されています。 これは、美しい動きを持つ髪の毛を使って、静止したポートレートをシネマグラフに変換するための新しいAIフレームワークの要約でした。目立つ欠点なく魅力的なモーションを与えることができます。興味がある方は、以下に引用されたリンクを参照してください。

「2023年に試してみることができるChatGPTのトップ22の代替品(無料および有料)」

ChatGPTは、さまざまなタスクにおいて最も有名で一般的に使用されているAIツールです。さまざまなコースや教材があり、その潜在能力を最大限に統合し活用するための知識も豊富なため、定期的に利用しているユーザーは関連する課題にもおなじみです。2021 年までは信頼性に欠け、限定的な知識しか持たなかったため、個人は代替手段を探し出すことを余儀なくされていました。検索を終了するため、ここではChatGPTの代替手段のリストをご紹介します。オプションを探索して、新しいお気に入りのAIを見つけましょう。 ライティング用のChatGPTの代替手段 1. Chatsonic (Writesonic) (無料および有料) このAIは、ChatGPTに似ていますが、ライティングで強化された機能を備えています。GPT-4の機能を活用しています。これは、カスタマイズ可能で使いやすい機能を提供する会話型AIであり、NLPおよびML技術を備えたものです。Googleの検索トレーニングによって、現在のイベントやトレンド情報を取り入れることができます。 プロンプト: クラス5の子供にAditya L-1について説明するための100語の魅力的なコンテンツを生成してください。 アクセスはこちら: Writesonic 2. Claude (無料および有料) Anthropicによる次世代の会話型AIです。Claudeは複数の入力を同時に受け付けることができます。ユーザーに役立ち、正直な無害なAIシステムを生成することを重視して開発されました。Claude AIは創造的なライティング、コーディング、および質問への回答が可能です。個々の利用に向け、異なる振る舞い、パーソナリティ、トーンに切り替えることができます。 プロンプト: インドへのイギリスの侵略につながった出来事の年表を列挙してください。 アクセスはこちら: Anthropic Claude もっと読む:…

「AWS Trainiumを使用した高速で費用効果の高いLLaMA 2の微調整」

大型言語モデル(LLM)は、開発者、科学者、技術者、起業家、および様々な産業の経営者たちの想像力と注意を引いていますこれらのモデルは、問題解決、要約、翻訳などに使用することができ、カスタマーサポートの会話エージェント、マーケティングのためのコンテンツ作成、コーディングアシスタントなどの応用分野で活用されています最近、MetaはLlama 2をリリースしました

『倫理と社会ニュースレター#5:ハグフェイスがワシントンに行くと、他の2023年夏の考え事』

人工知能(AI)における「倫理」について知っておくべき最も重要なことの一つは、それが「価値観」に関連しているということです。倫理は何が正しくて何が間違っているかを教えてくれるのではなく、透明性、安全性、公正などの価値観の語彙と優先順位を定めるための枠組みを提供します。今年の夏、私たちはAIの価値観についての理解を欧州連合、イギリス、アメリカの立法府に伝え、AIの規制の未来を形作るのに役立ちました。ここで倫理が光を放つのです:法律がまだ整っていないときに前進するための道筋を切り開くのに役立つのです。 Hugging Faceの主要な価値であるオープンさと責任を守るために、私たちはここで私たちが言ったことや行ったことのコレクションを共有しています。これには、私たちのCEOであるクレムが米国議会に対する証言や米国上院AI Insight Forumでの発言、E.U. AI Actに関するアドバイス、NTIAに対するAIの責任に関するコメント、そして私たちのChief Ethics Scientistであるメグの民主党議員団に対するコメントなどが含まれています。これらの議論の多くで共通していたのは、なぜAIのオープンさが有益であるのかという質問でした。私たちはこの質問に対する私たちの回答のコレクションをこちらで共有しています。 Hugging Faceのコア価値である民主化に則り、私たちは多くの時間を公に話すことに費やしてきました。そしてAIの世界で今起こっていることを説明するためにジャーナリストと対話する機会を与えられています。これには以下のものが含まれます: サーシャのAIのエネルギー使用と炭素排出に関するコメント(The Atlantic、The Guardian、2回、New Scientist、The Weather Network、The Wall Street Journal、2回)およびWall Street Journal op-edの一部の執筆;AIの終末論的なリスクに対する考え(Bloomberg、The Times、Futurism、Sky…

「時間差学習と探索の重要性:図解ガイド」

最近、強化学習(RL)アルゴリズムは、タンパク質の折りたたみやドローンレースの超人レベルの到達、さらには統合などの研究課題を解決することで、注目を集めています

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us