Learn more about Search Results 18 - Page 11

「音波センサーを使用したロボットのネットワークは、パイプを監視します」

研究者たちは、誘導音波センサーを使用することで、独立したロボットのネットワークが大型パイプの欠陥を検査できることを示しました

アリババAIは、Qwen-1.8B、Qwen-7B、Qwen-14B、Qwen-72B、およびQwen Chatシリーズを含むQwenシリーズをオープンソース化しました

最新モデルを持つ Alibaba Cloud の Qwen シリーズのオープンソース AI モデルを使用して、AI 技術の可能性をさらに押し上げています。 Alibaba は Qwen-1.8B と Qwen-72B のリリースとともに、特殊なチャットモデルとオーディオモデルを提供することで AI ソリューションを拡大しました。 Alibaba の AI 機能の開発に対する献身は、これらのモデルによって示されており、言語処理とオーディオ処理のパフォーマンスと多様性が向上しています。 Qwen-1.8B とその大きな相当する Qwen-72B…

スターリング-7B AIフィードバックからの強化学習によるLLM

UCバークレーの研究チームが、オープンソースの大規模言語モデル(LLM)であるStarling-7Bを導入しています。このモデルは人工知能フィードバック(RLAIF)からの強化学習を使用し、最新のGPT-4ラベル付きランキングデータセットであるNectarの力を活用しています。洗練された報酬トレーニングとポリシーチューニングパイプラインを組み合わせたStarling-7B-alphaは、言語モデルの性能において新たな基準を打ち立て、MT-Benchを除くすべてのモデルをしのぐ性能を発揮しています(ただし、OpenAIのGPT-4とGPT-4 Turboには及ばない)。 強化学習の可能性 教師あり微調整はチャットボットシステム開発において効果を示していますが、人間のフィードバックからの強化学習(RLHF)またはAIフィードバック(RLAIF)の可能性は限定的に調査されてきました。Zephyr-7BやNeural-Chat-7Bのような既存のモデルは、主導的な微調整(SFT)モデルと比較してRLHFの潜在能力を十分に示していませんでした。 この問題に対処するため、研究チームはNectarを導入しました。これは、チャットに特化した高品質なランキングデータセットであり、183,000のプロンプトと3,800,000のペアワイズ比較からなります。このデータセットはRLHFの研究をより詳細に行うことを目的とし、さまざまなモデルから収集されたさまざまなプロンプトを提供しています。 報酬モデルであるStarling-RM-7B-alphaおよびファインチューンされたLLMであるStarling-LM-7B-alphaのHuggingFaceでのリリースは、オープンソースAI研究の重要な進展を示しています。このモデルのMT-Benchスコアは、7.81から印象的な8.09に向上し、チャットボットの助けになる度合いを測るAlpacaEvalの向上も88.51%から91.99%に大幅に改善されました。 他にも読む: 強化学習とは何か、そしてそれはどのように機能するのか(2023年) モデルの評価 Starling-7Bの評価には独自の課題があります。このLLMは、RLHF後の助けや安全性の機能が向上していることを示すMT-BenchおよびAlpacaEvalスコアの改善が証明されています。ただし、知識ベースの質問応答や数学、コーディングに関連する基本的な機能は一貫しているか、わずかな回帰を経験しています。 直接チャットや匿名の比較のためにLMSYSチャットボットアリーナに組み込まれることで、人間の選好をテストするプラットフォームが提供されます。評価はまた、チャットモデルのベンチマークとしてのOpenLLMリーダーボードの使用における制限を強調し、Alpaca EvalとMT-Benchによるニュアンスのある評価の重要性を強調しています。 合成優先データのGoodhartの法則 考慮すべき重要な点は、合成された優先データのGoodhartの法則です。より高いMT-Benchスコアは、GPT-4による改善されたモデルの性能を示していますが、それが必ずしも人間の選好と相関するわけではありません。RLHFは主に応答スタイルを向上させることに寄与しており、特に助けや安全性の側面でスケーリングオンラインRL方法のポテンシャルを示しています。 制限事項 Starling-7Bは優れた性能を持っていますが、推論や数学に関わるタスクには苦労しています。また、ジェイルブレイキングのプロンプトへの感受性や出力の冗長さなどの制限も認識されています。研究チームは改善のためにコミュニティとの協力を求めており、RLHFを使用したオープンデータセット、報酬モデル、言語モデルの向上に取り組んでいます。 私たちの意見 RLAIFアプローチと綿密なデータセット作成を備えたStarling-7Bは、言語モデルにおける強化学習のポテンシャルを示すものです。課題や制約はまだ残っていますが、改善への取り組みと大規模なコミュニティとの協力により、Starling-7BはAI研究の進展する風景において輝く存在となっています。RLHFメカニズムの洗練とAI安全性研究の最前線への貢献について、さらなるアップデートをお楽しみに。

「RetinaNetとKerasCVを使用した物体検出」

画像セグメンテーションをベースにしたミニプロジェクトを終えた後(こちらをご覧ください)、コンピュータビジョンの一環として、別の一般的なタスクに取り掛かる準備ができました:オブジェクト検出ですオブジェクト検出とは...

「GoとMetalシェーディング言語を通じてAppleのGPUをプログラミングする」

以下では、GoとネイティブCの間でcgoを使用してインターフェースを作成するプロセス、これを使用してAppleのMetal Performance ShadersフレームワークのObjective-Cバインディングとインターフェースを作成する方法について説明します

Amazon Kendraを使用して保険請求をインテリジェントに処理するために、Amazon Comprehendで作成されたカスタムメタデータを使用します

構造化データとは、データベース内の列に格納された情報のように固定されたパターンに従うデータ、およびテキスト、画像、またはソーシャルメディアの投稿などの特定の形式やパターンを持たない非構造化データの両方が、さまざまな組織で生産され、消費され続けています例えば、国際データコーポレーション(IDC)によると、[…]

「クリスマスラッシュ」3Dシーンが今週の「NVIDIA Studio」でホリデーのチアをもたらします」

編集者の注記:この投稿は、我々の週刊「In the NVIDIA Studio」シリーズの一部であり、特集アーティストを称え、創造的なヒントやトリックを提供し、そしてNVIDIA Studioテクノロジーが創造的なワークフローを向上させる方法をデモンストレーションしています。 友達や家族、そして今週のIn the NVIDIA Studioアーティスト、3Dエキスパートボゾ・バロブによる美しく描かれたサンタのアニメーションを楽しむ季節です。 今週は、驚くべきマイルストーンも達成されました。NVIDIA RTXパワードのゲームとクリエイティブアプリが500以上、レイトレーシングやNVIDIA DLSSなどのAIパワードテクノロジーに対応して利用できます。Adobe Creative Cloudスイート、Autodesk Maya、Blender、Blackmagic DesignのDavinci Resolve、OBS、Unityなど、最も人気のあるアプリ120以上がRTXを使用してワークフローを数倍に加速し、新しいAIツールと機能を提供し、リアルタイムのレイトレーシングプレビューを可能にしています。 これを祝して、NVIDIA GeForceではギフトカード、希少な#RTXONキーボードキーキャップなどをプレゼントするキャンペーンを開催しています。参加方法については、GeForceのFacebook、Instagram、TikTok、またはX(以前のTwitter)をフォローしてください。 💚 THANK YOU FOR 500…

「AIと働き方の未来:AI時代における労働力の再教育」

AIは私たちの働き方を変えつつあり、それは想像以上の速さで進行しています毎週1億人以上が既にChatGPTを利用しており、半数以上の従業員がAIツールを仕事で使用していると回答しています確かにAIは特定の人々が仕事をより良く遂行するのに役立つでしょうが、多くの人々は未だに使用方法や利点について疑問を抱いています...

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us