Search Results GPT4

「ハグフェース上のトップ10大きな言語モデル」

イントロダクション Hugging Faceは、自然言語処理の愛好家や開発者にとって宝庫となり、さまざまなアプリケーションに簡単に統合できる事前学習済み言語モデルの幅広いコレクションを提供しています。Large Language Models（LLM）の世界で、Hugging Faceは頼りになるプラットフォームとして際立っています。この記事では、Hugging Faceで利用可能なトップ10のLLMモデルを紹介し、言語理解と生成の進化する景色に貢献します。さあ、始めましょう！ Mistral-7B-v0.1 Mistral-7B-v0.1は、70億のパラメータを誇る大規模言語モデル（LLM）です。これは事前学習済みの生成テキストモデルとして設計されており、Llama 2 13Bが検証されたドメインで設定したベンチマークを上回ることで知られています。このモデルは、グループ化されたクエリアテンションやスライディングウィンドウアテンションなどの注意機構に特定の選択を行ったトランスフォーマーアーキテクチャに基づいています。Mistral-7B-v0.1は、Byte-fallback BPEトークナイザーも組み込んでいます。ユースケースとアプリケーションテキスト生成：Mistral-7B-v0.1は、コンテンツ作成、創造的な文章作成、または自動ストーリーテリングなど、高品質のテキスト生成を必要とするアプリケーションに適しています。自然言語理解：高度なトランスフォーマーアーキテクチャと注意機構を備えたこのモデルは、感情分析やテキスト分類などの自然言語理解を必要とするタスクに適用することができます。言語翻訳：生成能力と大規模なパラメータサイズを考慮すると、このモデルはニュアンスのある文脈に即した正確な翻訳が重要な言語翻訳タスクで優れたパフォーマンスを発揮するかもしれません。研究開発：研究者や開発者は、さまざまな自然言語処理プロジェクトでのさらなる実験や微調整のためにMistral-7B-v0.1をベースモデルとして活用することができます。このLLMにはこちらでアクセスできます。 Starling-LM-11B-alpha この大規模言語モデル（LLM）は、110億のパラメータを持ち、NurtureAIから生まれました。このモデルは、その基盤としてOpenChat 3.5モデルを利用し、AIのフィードバックからの強化学習（RLAIF）によるfine-tuningを経ています。このアプローチでは、ヒトによってラベル付けされたランキングのデータセットを利用してトレーニングプロセスを誘導します。ユースケースとアプリケーション Starling-LM-11B-alphaは、マシンとの対話方法を革新する潜在的な大規模言語モデルであり、オープンソースの性質、優れたパフォーマンス、多様な機能を備えており、研究者、開発者、クリエイティブプロフェッショナルにとって貴重なツールです。…

NexusRaven-V2をご紹介します：13B LLMは、ゼロショット機能呼び出しでGPT-4を凌駕し、ナチュラルランゲージの指示を実行可能なコードに変換する能力を持っています

<img alt=”” src=”https://ai.miximages.com/www.marktechpost.com/wp-content/uploads/2023/12/Screenshot-2023-12-12-at-12.42.47-AM-1024×623.png”/><img alt=”” src=”https://ai.miximages.com/www.marktechpost.com/wp-content/uploads/2023/12/Screenshot-2023-12-12-at-12.42.47-AM-150×150.png”/>LLMsは、コード関連のデータセットで微調整することができ、関数呼び出しを含むコードスニペットを生成することができます。これらのモデルは、コンテキストやプロンプトによって提供された入力に基づいて、関数呼び出しを含むコードを提案または生成することができます。言語モデルは、コードに関連するクエリや指示の自然言語理解に使用することができます。開発者は質問や説明を入力し、モデルはそれらを解釈して関連する関数呼び出しやコードセグメントを提供することができます。LLMsは、提供されたコンテキストや部分的なコードに基づいて、関数呼び出しを提案したり関連する関数を提案したりすることによって、コード補完を支援することができます。これにより、開発者はより迅速かつ正確にコードを記述することができます。LLMsは、特定のタスクや問題の説明に基づいて、適切なAPIや手順をガイドすることで、開発者がコード内で呼び出すべき適切な関数を見つけるのを支援することができます。LLMsを開発環境に統合することで、開発者に対して関数呼び出し、パラメータのタイプ、または潜在的なエラーに対してリアルタイムのサポートを提供することができます。Nexusflowの研究者は、オープンソースのLLMモデル、<a href=”https://www.voagi.com/nexusravenv2-outperforms-gpt4-in-nexusflows-latest-battle.html”>NexusRaven-V2</a>を提案しています。これは自然言語の指示を実行可能なコードに変換してツールを使用することができます。OpenAIアシスタントAPIは、コパイロットとエージェントがソフトウェアツールを使用するための鍵として機能します。NexusRaven-V2は、コパイロットとエージェントのオープンソースモデルを進化させることを目指しています。NexusRaven-V2は、ネストや複合関数を使用する人間が生成したユースケースで、関数呼び出しの成功率でGPT-4を最大7％上回っています。NexusRavenはMetaのCodeLlama-13 Bインストラクションにチューニングされた指示です。Nexusflowのパイプラインを使用して、プロプライエタリなLLMを使用せずにオープンコードのコーポラから情報源を提供しています。コミュニティ開発者と企業の両方に対して商業許容です。当社の人間によるベンチマークで、NexusRaven-V2は、関数呼び出しの成功率において、最新のGPT-4モデルよりも平均で4％高い成功率を示すことが観察されました。なお、ネストや複合関数呼び出しを必要とする4つの厳しいタスクでは、NexusRaven-V2の方がGPT-4よりも堅牢性が高いと言えます。また、開発者の関数の説明におけるバリエーションを処理する際にも、NexusRaven-V2はGPT-4よりも優れた性能を発揮します。チームは、ユーザーがメインストリームのプロプライエタリな関数呼び出しAPIをシームレスにNexusRaven-V2で置き換えることができるオープンソースのユーティリティアーティファクトをリリースしました。また、オンラインデモやコラボノートブックを提供してオンボーディングと統合デモを行っています。彼らは評価ベンチマーク<a href=”https://www.voagi.com/call-all-functions.html”>Nexus-Function-Calling</a>をオープンソース化し、Huggingfaceの<a href=”https://www.voagi.com/create-and-analyze-advanced-machine-learning-models-using-the-sagemaker-canvas-model-leaderboard.html”>リーダーボード</a>を確立しています。このリーダーボードには、さまざまな関数呼び出しのユースケースと難易度をカバーした、実生活で人間が選定した関数呼び出しの例が多数収録されています。将来的には、関数呼び出しのLLMは教育現場において、学習者がリアルタイムのサポートを受けながら関数の呼び出し方を正しく学び、プログラミングの概念の理解を促進することができるでしょう。

人間に戻る：AIの道：コードからぬいぐるみまでの旅

人工知能（AI）の急速に進化する風景の中で、私たちはアプローチの転換を求める分岐点に立っています。特にシリコンバレーを中心に、テック業界では既存の製品にAIを統合し、増分のイノベーションを生み出す傾向があります。この戦略は、AIに対する一般の人々の理解を深め、抵抗を減らすという点で重要な役割を果たしてきました。しかし、このアプローチは頭打ちになりつつあります。AIの革命的な可能性を実現するためには、人間の根本的なニーズと行動に戻り、AIアプリケーションのための新しい革新的な「チャネル」を築かなければなりません。AIは感性的にならなければなりません！その重要性を強調するため、著名な作家でありデザイン思考家であるドン・ノーマンは、彼の画期的な著書「日常のデザイン」で、製品デザインを人間の本能と反応に整合させることの重要性を強調しています。この原則は、AIアプリケーションにおいても重要です。既存の製品にAIを埋め込むだけではなく、基本的な人間の経験とニーズを理解し、活用することが重要です。これらの人間中心のデザインを発見するための効果的な手法の一つは、「デザインフィクション」です。この手法は、未来に自分自身を投影して、SF要素や弱いシグナルを活用して新たな使い方を概念化することを意味します。将来のシナリオを想像し、逆算して現在の製品に至るロードマップを作成することで、革新的な使い方を見つけることができます。 AIの変革的な性質を持つためには、持続可能な統合のための新たなパラダイムが必要です。そのためには、ある程度の科学的な洞察力が必要です。DeepMind、Google Research、FAIR、OpenAI、およびNvidiaなどの組織は、科学的な進歩によってこれに足場を築いています。ChatGPTなどの初期のプロトタイプは驚きと可能性を提供しました。次のステップでは、AIを現行の製品に埋め込んで利用性を向上させることが求められます。しかし、真に革新的な使い方を見つけるためには、技術の可能性に合ったものを特定することが重要です。 iPhoneのタッチスクリーンやApp Storeによってもたらされた革命を考えてみてください。スティーブ・ジョブズは、ブラックベリーのキーボードではなくタッチスクリーンを提唱したのは単なる姿勢ではなく、ユーザーの好みとニーズを深く理解していたからです。このアプローチは、最近OpenAIとの議論で示唆されたJony Iveの考え方に似ています。AIにおける同様の画期的な開発を暗示しています。これらの革新的な使い方を特定するために、私たちは現行の製品にとどまるのではなく、SFや映画の世界に飛び込んでみるべきです。作家たちはそこで未来を予見しています。その一つの良い例は映画やテレビシリーズ「リミットレス」です。NZTという薬を通して人間の能力を高めるという中心テーマは、AIの増強パラダイムと共鳴します。主人公のエディ・モラやブライアン・フィンチは、注意を分散させず、後で細部を思い出すことを示しています。このコンセプトは、深い人類学的なニーズと増強パラダイムに合致します。WhatsAppの会話に集中していたとき、チームメイトが今朝コーヒーマシンであなたに話したことを思い出せたら、それはどんなに素晴らしいことでしょうか。 Rewind AIなどの企業も同様のコンセプトを探求しています。Rewind AIは、基本的なフォトエディティングやチャットボットを超える革命的な技術です。ユーザーは、生活の瞬間を卓越した明瞭さと詳細さで再訪・思い出すことができます。それを物語的な「リミットレス」の薬のようなデジタル版と考えてください。Rewind AIを使用すると、ユーザーは写真アルバムをめくるように、過去の経験を手軽にアクセスして再生することができます。さらに、Rewind AIは、スクリーンから離れているときでも、日常生活を記憶する力を与えるウェアラブル技術の開発も模索しています。最近リリースされたGemini Nanoのような軽量AIモデルのポテンシャルも強調されています。このAI技術の最新進歩は、コンパクトで効率的かつ驚くべきパワフルさを備えた、機械学習の未来を具現化しています。このような軽量でありながら強力なAIモデルを受け入れることで、AIが単なる臨時のアシスタントでなく、私たちの日常生活の一部として完全かつなめらかに統合された世界に一歩近づくのです。結論として、AIの未来は既存の製品を単に強化するだけでなく、私たちの最も深い人間の本能とニーズと共感する新しい製品を作り出すことにあります。デザインフィクションからインスピレーションを得て、人間の行動の本質を理解することにより、革新的でありながら自然な傾向と欲望と深い共鳴を持つAIアプリケーションを開発することができます。私たちがこの旅に乗り出すにあたり、先見の明のあるデザイナーとAIの専門家との協力は、この変革的なテクノロジーの真の可能性を引き出し、AIが単なるツールではなく、私たちの人間の体験の拡張となる未来への道を開きます。この記事は「人間に戻る：AIの旅、コードから愛撫へ」がMarkTechPostで最初に掲載されました。

「GPTの進化を探る ChatGPT-4の新機能と、コンバーショナルAIの再定義」

以前のバージョンをベースに、多様性と倫理的考慮を特徴とするConversational AIのChatGPT-4の進化を探求し、新たな可能性を解き放つ

「E.U.は画期的な人工知能規制に合意」

「A.I.アクトに関する合意は、人工知能の使用を制限する世界で最初の包括的な試みの一つを確固たるものとします」

スタンフォードの研究者が「予測音楽トランスフォーマー」を紹介：音楽作曲における創造的な制御を向上させる画期的なAIツール

美しい画像や感動的なエッセイを生成するジェネレーティブAIは、多くの場合、ユーザーにはほとんど制御が残されません。一部のツールは音楽を生成しますが、作曲家が望むよりも精密な制御が必要です。あなたはプロセスをガイドすることはできません。あなたが手に入るものを受け入れる必要があります。予測音楽変換器は、象徴的な音楽として知られるユニークな形式で作曲家により大きな所有権を与える新たなツールです。スタンフォードの学者によって開発されたこのツールは、作曲家が創造的な作曲プロセスで主導権を握ることを可能にします。彼らは曲の一部を書き、その後モデルに残りを埋めるよう依頼したり、伴奏を提案したり、代替バリエーションを提供したりすることができます。これは他のツールとは異なります。鍵はそのアプローチにあります-それは作曲家の助手です。単にランダムな作曲を吐き出すのではなく、それは作曲のルールを理解しています。高度な音楽のトレーニングを受けていないユーザーでも、システムと一緒に遊び、自分の好みに基づいてガイドすることができます。この音楽変換器は、ジェネレーティブプレトレーニングトランスフォーマーアーキテクチャ（GPT）上に構築されています。これはChatGPTなどの言語モデルを駆動する技術と同じものです。それがユニークなのは、オーディオそのものではなく象徴的な音楽に焦点を当てていることです。モデルは予想される音楽要素を予測するために訓練されており、より制御可能で対話型の出力を提供することができます。このツールは利用可能ですが、音楽制作ソフトウェアにシームレスに統合する必要があります。ただし、開発者は現在、これを実現するために積極的に取り組んでいます。目標は、作曲家やミュージシャンに、彼らの生活をより簡単で楽しいものにするツールを提供することです。音楽理論の専門家でなくても、より多くの人々が音楽作曲に関与する可能性を広げることです。まとめとして、予測音楽変換器は、AIが音楽を生成し、テクノロジーと協力して、ユーザーが音楽を好みのように形作り、作り上げることを可能にしています。継続的な改良と統合の取り組みにより、このツールは音楽家やプロデューサーにとって必須のものとなり、音楽作曲のアプローチ方法を革新するかもしれません。投稿：スタンフォードの研究者が予測音楽変換器を紹介：音楽作曲におけるクリエイティブな制御を向上させる画期的なAIツール – MarkTechPost。

「2023年のトップ8のAIトレンド：年間レビュー」

葉っぱが金色に変わり、12月の寒さが広がる中、人工知能の領域で目覚ましい進歩が見られた今年を振り返る時が来ました。2023年は単なる進歩の年ではありませんでした。それはトライアンフの年であり、AIが成し遂げられる限界が繰り返し押し広げられ、再定義された年でした。LLM（大規模言語モデル）の能力における画期的な進展から、前例のないほど世界とのナビゲーションや相互作用が可能な自律エージェントの登場まで、この年はこの変革的な技術の無限の可能性を示すものでした。この包括的な探求の中で、私たちは2023年のAIを定義した8つの主要なトレンドについて掘り下げ、産業を再構築し、未来を革命化する革新を明らかにしていきます。だから、AI愛好家の皆さん、私たちは技術史の記録に永遠に刻まれる一年についての旅に出発です。 RLHFとDPOの微調整 2023年は、大規模言語モデル（LLM）の能力を向上させるための重要な進展が見られました。2つの主要なアプローチが登場しました：人間のフィードバックに基づく強化学習（RLHF）：この手法は、人間のフィードバックを活用してLLMの学習プロセスをガイドし、持続的な改善と進化するユーザーのニーズや好みに対応させることができます。このインタラクティブなアプローチにより、LLMは複雑または主観的な領域において微妙な理解力と意思決定能力を開発することができます。直接的な選好最適化（DPO）：：DPOはよりシンプルな代替手法であり、明示的な強化信号を必要とせずにユーザーの選好に直接最適化します。このアプローチは効率性とスケーラビリティを重視し、より速い適応と展開を必要とするアプリケーションに最適です。そのすっきりした性格により、ユーザーフィードバックに基づいてLLMの振る舞いを迅速に調整することができ、進化する好みに合わせることができます。 RLHFとDPOはLLMの開発における重要な進展を表していますが、既存の微調整手法を置き換えるのではなく、補完するものです：事前学習：大規模なテキストとコードのデータセットを用いてLLMを訓練し、一般的な言語理解能力を学習させること。微調整：特定のタスクまたはデータセットに基づいてLLMをさらに訓練し、特定のドメインやアプリケーションに適した能力を調整すること。マルチタスク学習：LLMを複数のタスクに同時に訓練することで、共有表現を学習し、各タスクのパフォーマンスを向上させること。 LLMの効率性に対処する LLMの能力が向上するにつれて、計算上の制約とリソースの限界が重要な懸念事項となりました。その結果、2023年の研究はLLMの効率性の向上に焦点を当て、以下のような技術の開発をもたらしました： FlashAttention：この革新的なアテンションメカニズムは、LLMの計算コストを大幅に削減します。これにより、より速い推論と訓練が可能になり、LLMをリソースに制約のある環境でより実用的に利用し、実世界のアプリケーションに統合することができるようになります。 LoRA および QLoRA：LoRAやQLoRAなどの手法は、2023年にも提案された軽量かつ効率的なLLMの微調整方法を提供します。これらの手法は、既存のLLMアーキテクチャに追加された小さなモジュールであるアダプターに依存し、再トレーニングすることなくカスタマイズを可能にします。これにより、著しい効率の向上、より速い展開時間、さまざまなタスクへの適応性の向上が実現されます。これらの進展は、効率的なLLMへの需要の増大に対応し、この強力な技術への広範な導入の道を開き、結果としてこの技術へのアクセスを民主化することにつながります。検索補完生成（RAG）の浸透純LLMは巨大な可能性を秘めていますが、それらの正確性と実証的根拠に関する懸念は依然として存在しています。検索補完生成（RAG）は、既存のデータや知識ベースとLLMを組み合わせることで、これらの懸念に対処する有望な解決策として登場しました。このハイブリッドアプローチにはいくつかの利点があります：エラーの減少：外部情報から事実情報を取り込むことにより、RAGモデルはより正確で信頼性のある出力を生成することができます。拡張性の向上：RAGモデルは純LLMに必要な大規模なトレーニングリソースの必要性を排除し、大規模なデータセットに適用することができます。低コスト：既存の知識リソースを利用することにより、LLMのトレーニングおよび実行に関連する計算コストを削減することができます。これらの利点により、RAGは検索エンジン、チャットボット、コンテンツ生成など、さまざまなアプリケーションにおける貴重なツールとして位置付けられています。自律エージェント…

「 Omnivore に会いましょう：SiBORG Lab は OpenUSD と NVIDIA Omniverse を使ってアクセシビリティのアプローチを高める」

アクセシビリティは、すべてのデザイナーがスペースや製品を構築する前に考慮しなければならない重要な要素ですが、評価プロセスは従来、手間と時間がかかるものでした。ニュージャージー工科大学の建築とデザインの助教授であるマシュー・シュワルツは、NVIDIA OmniverseプラットフォームとUniversal Scene Descriptionフレームワーク（別名OpenUSD）を使用して、建築家、インテリアデザイナー、産業デザイナーがこの課題に取り組むのを支援しています。シュワルツの研究および設計ラボSiBORG（シミュレーション、バイオメカニクス、ロボット工学、グラフィックス）は、特にアクセシビリティ、人間要因、自動化に関連するデザインのワークフローを理解し、改善することに焦点を当てています。シュワルツと彼のチームは、研究プロジェクトのためのアルゴリズムを開発し、それらを利用可能な製品に転換します。 Omniverseを使用することで、チームはシュワルツのコードを使用してグラフやそれが生成するパスを視覚化することができます。これは、デザイナーが建築基準と居住者の安全性をより良く評価するのに役立ち、重要なアクセシビリティの洞察を提供します。 https://blogs.nvidia.com/wp-content/uploads/2023/12/Pathloop.mp4 OpenUSDの力従来、建築設計プロセス中のアクセシビリティや環境条件に関するフィードバックは、建築基準分析に限定されていました。シュワルツの研究により、OmniverseとOpenUSDをシームレスに統合することで、デザイナーはこの壁を乗り越えることができるようになりました。以前は、彼はシミュレーションとモデリングのプロジェクトのさまざまな側面を達成するために複数のアプリケーションの切り替えが必要でした。彼のワークフローは、人々をサポートするUnityや3Dモデリング機能を提供するMcNeel Rhino3Dなどのツールの間で分割されることが多かったのです。 OpenUSDを使用することで、彼は研究、Pythonコード、3D環境とレンダリング、お気に入りのツールをOmniverseに統合することができます。彼は言いました。「Omniverseに魅了されたのは、Pythonアプリケーションプログラミングインタフェースを強力な物理、レンダリング、アニメーションソフトウェアと組み合わせることができる点でした。チームは、柔軟なPython APIをOmniverseで活用して、ほぼすべてのユーザーインターフェースを開発しました。」シュワルツのチームは、OpenUSDに互換性のあるプログラムと相互作用できる汎用的なデータ分析ツールをOmniverseを使用して活用しています。彼は言いました。「OpenUSDとOmniverseを使用すると、研究の範囲を広げることができました。データ分析と可視化を設計プロセスと簡単に組み合わせることができます。」リアルなレンダリングとシミュレーションの実行シュワルツはまた、Omniverseを使用して人々の動きや相互作用をシミュレートしています。彼は、リアルタイムの可視化を可能にする2つのNVIDIA RTX A4500 GPUsを使用して大規模な群衆のシミュレーションとアニメーションを高速化しています。これにより、デザイナーは移動能力の制限がある人々がどのように空間を移動し、相互作用するかに関する貴重な洞察を得ることができます。シュワルツは言いました。「看板を最も目立つ位置に配置するための最適な場所を示すこともできます。シミュレーションの結果は、早期の設計段階で取られるパスを可視化するために使用できます。これにより、建築基準に問題が生じることを防ぎながら、最小の要件を超えるデザインを作成できます。」…

「LLMテクノロジーの理解」

「LLMテクノロジーの進歩を発見しましょうLLMテクノロジーの世界を探求し、AIとNLPの分野における重要な役割を見つけましょう」

グラフ、分析、そして生成AI グラフニュースレターの年

グラフ、分析、および生成AIグラフとAIが結びつくさまざまな方法と、業界と研究のニュースについての説明

Learn more about Search Results GPT4 - Page 4