Learn more about Search Results the Hub - Page 2
- You may be interested
- マイクロソフトリサーチは、Florence-2と...
- 会社の文書から洞察を抽出するために、ビ...
- 「Googleが人生のアドバイスを提供するAI...
- データサイエンスがどのように価値を提供...
- 「UBCカナダの研究者が、都市ドライバーに...
- データ体験の再発明:生成的AIと現代的な...
- 「Jepson Taylorと共に未来のAIを解き放つ」
- AIAgentに会ってみましょう:APIキーを必...
- 「単なる爬虫類以上:ブラックボックスモ...
- Terraformのインポート:それは何か、そし...
- fairseqのwmt19翻訳システムをtransformer...
- コンピュート最適な大規模言語モデルトレ...
- YOLOv7 最も先進的な物体検出アルゴリズム?
- 「2020年と2021年のトップの声、グレッグ...
- サリー大学の研究者が新しい人工知能(AI...
「GiskardはHuggingFaceにGiskard Botをリリースします:HuggingFace Hubにプッシュした機械学習モデルの問題を自動的に検出するボットです」
2023年11月8日に発表された画期的な開発では、Giskard Botが機械学習(ML)モデルのゲームチェンジャーとして登場し、大規模言語モデル(LLM)や表形式のモデルに対応しています。このオープンソースのテストフレームワークは、モデルの整合性を確保するために専用されており、HuggingFace(HF)プラットフォームとシームレスに統合された多くの機能を提供しています。 Giskardの主な目標は明確です。 脆弱性の特定。 ドメイン固有のテストの生成。 CI/CDパイプライン内でのテストスイートの自動化実行。 Giskardは、Hugging Faceのコミュニティベースの哲学に沿ったAI品質保証(QA)のオープンプラットフォームとして機能します。 導入された最も重要な統合の1つは、HFハブ上のGiskardボットです。このボットにより、Hugging Faceのユーザーは、新しいモデルがHFハブにプッシュされるたびに自動的に脆弱性レポートを公開することができます。これらのレポートは、HFディスカッションおよびモデルカードでプルリクエストを介して表示され、バイアス、倫理的な懸念、堅牢性などの潜在的な問題の即座の概要を提供します。 記事の中で示されている魅力的な例は、Giskardボットの能力を示しています。Twitter分類にRobertaを使用した感情分析モデルがHF Hubにアップロードされたとします。Giskardボットは、テキスト特徴で特定の変換を行うことで予測を大幅に変更する5つの潜在的な脆弱性を迅速に特定します。これらの調査結果は、トレーニングセットの構築時にデータ拡張戦略を実装する重要性を強調し、モデルの性能に深く入り込むものです。 Giskardの特徴は、量だけでなく品質にもコミットしていることです。このボットは脆弱性を定量化するだけでなく、定性的な洞察も提供します。モデルカードに変更を提案し、バイアス、リスク、または制約事項を強調します。これらの提案は、HFハブ内のプルリクエストとしてシームレスに表示され、モデル開発者のレビュープロセスを効率化します。 Giskardスキャンは、標準的なNLPモデルに限定されるものではありません。これはLLMにも対応し、IPCCレポートを参照するLLM RAGモデルの脆弱性スキャンを展示します。スキャンは、幻想、誤情報、有害性、機密情報の開示、および堅牢性に関連する懸念を明らかにします。たとえば、IPCCレポートの作成に使用される方法論に関して機密情報を明らかにしない問題が自動的に特定されます。 しかし、Giskardは識別にとどまることはありません。ユーザーには、Hugging Face Spacesの専門ハブにアクセスすることができ、モデルの障害についての具体的な洞察を得ることができます。これにより、ドメインの専門家との協力や、独自のAIユースケースに合わせたカスタムテストの設計が容易になります。 Giskardによってデバッグテストが効率的に行われます。このボットは、問題の根本原因を理解し、デバッグ中に自動化された洞察を提供します。テストを提案し、予測への単語の寄与を説明し、洞察に基づいた自動アクションを提供します。 Giskardは一方通行ではありません。ドメインの専門家からのフィードバックを「招待」機能を通じて奨励しています。この集約されたフィードバックは、モデルの精度と信頼性を高めるために開発者をガイドする、潜在的なモデルの改善の包括的なビューを提供します。
「Amazon SageMaker Model Registry、HashiCorp Terraform、GitHub、およびJenkins CI/CDを使用して、マルチ環境設定でのパイプラインの促進を行う」
「機械学習運用(MLOps)プラットフォームを組み立てることは、人工知能(AI)と機械学習(ML)の急速に進化する状況において、データサイエンスの実験と展開のギャップをシームレスに埋めるため、モデルのパフォーマンス、セキュリティ、コンプライアンスの要件を満たす組織にとって必要不可欠です規制とコンプライアンスの要件を満たすためには、[…]」
はい、GitHubのCopilotは(実際の)秘密を漏洩する可能性があります
研究者たちは、CopilotとCodeWhispererから有効なハードコードされた秘密を抽出し、新たなセキュリティリスクを明らかにしました
トレンドのAI GitHubリポジトリ:2023年11月6日の1週間
11月6日の週ですので、今週のトップ5リポをチェックする時間です今週は、教育に重点を置いた生成型AIのリポから、オープンソースの支払いプロセッサまで、新しいエントリのセットがありますでは、どれが上位になったかを見てみましょう...
UCバークレーとスタンフォード大学の研究者が、複数の教師からの報酬を学習するための人工知能フレームワークである「Hidden Utility Bandit(HUB)」を紹介しました
強化学習(RL)において、学習プロセスに人間からのフィードバックを効果的に統合することは、重要な課題として浮上しています。特に、複数の教師を扱う場合には、報酬学習においてこの課題が特に顕著となります。RLHFシステムにおける教師の選択にまつわる複雑さは、革新的なHUB(未知のベータを持つ人間とのループ)フレームワークを提案する研究者によって解決されました。このフレームワークは、教師の選択プロセスを効率化し、それによりRLHFシステム全体の学習成果を向上させることを目指しています。 既存のRLHFシステム内の手法は、学習効用関数の複雑さを効率的に管理する上で制限があります。この制約から、教師の選択に対するより洗練された総合的なアプローチが必要であることが浮き彫りになっています。HUBフレームワークは、RLHFパラダイム内での教師の任命を取り扱うための構造化されたシステム的アプローチを提供することで、この課題に対処する解決策として登場しました。従来の手法とは異なり、教師への積極的なクエリに重点を置くことで、より深い学習効用関数の探索が可能となり、複数の教師を扱う複雑なシナリオでも洗練された推定値を得ることができます。 HUBフレームワークの核となるのは、教師の選択と学習目標の最適化を統合した部分オブザーバブルマルコフ決定過程(POMDP)としての機能です。この統合は、教師の選択だけでなく、学習目標も最適化するためのものです。その効果的な点は、教師への積極的なクエリによって、学習効用関数のより緻密な理解が可能になり、それによって学習効用関数の推定の精度が向上することです。このPOMDPベースの手法を組み込むことによって、HUBフレームワークは、複数の教師からの学習効用関数の複雑さを巧みに扱い、最終的には学習効用関数の推定の精度とパフォーマンスを向上させることができます。 HUBフレームワークの強みは、多様な現実世界のドメインでの実践的な適用性に最も表れています。論文の推奨やCOVID-19ワクチンのテストといった領域での包括的な評価を通じて、このフレームワークの優位性が輝きます。論文の推奨の領域では、学習成果を効果的に最適化する能力がフレームワークの適応性と実用性を示しています。同様に、COVID-19ワクチンのテストでの成功した利用は、緊急で複雑な課題に対処する可能性を示しており、これにより医療や公衆衛生の進歩に寄与しています。 結論として、HUBフレームワークはRLHFシステムにおいて重要な貢献です。その体系的かつ構造化されたアプローチは、教師の選択プロセスを効率化するだけでなく、その選択の背後にある意思決定の戦略的重要性を強調しています。特定の文脈に最も適した教師を選択する重要性を重視するフレームワークとして、HUBフレームワークはRLHFシステムの総合的なパフォーマンスと効果を向上させるための重要なツールとなります。様々なセクターでのさらなる発展と応用の可能性は、AIと機械学習に基づくシステムの将来に対する有望な兆しとなっています。
機械学習のオープンデータセットを作成中ですか? Hugging Face Hubで共有しましょう!
このブログ投稿は誰のためですか? データ集中型の研究を行っている研究者ですか?研究の一環として、おそらく機械学習モデルの訓練や評価のためにデータセットを作成しており、多くの研究者がGoogle Drive、OneDrive、または個人のサーバーを介してこれらのデータセットを共有している可能性があります。この投稿では、代わりにHugging Face Hubでこれらのデータセットを共有することを検討する理由を説明します。 この記事では以下を概説します: なぜ研究者はデータを公開共有すべきか(すでに説得されている場合は、このセクションはスキップしてください) 研究者がデータセットを共有したい場合のHugging Face Hubのオファー Hugging Face Hubでデータセットを共有するための始め方のリソース なぜデータを共有するのですか? 機械学習は、さまざまな分野でますます利用され、多様な問題の解決における研究効率を高めています。特にタスクやドメインに特化した新しい機械学習手法を開発する際には、データがモデルの訓練や評価において重要です。大規模な言語モデルは、生物医学のエンティティ抽出のような特殊なタスクではうまく機能せず、コンピュータビジョンモデルはドメイン特化の画像の分類に苦労するかもしれません。 ドメイン固有のデータセットは、既存のモデルの限界を克服するために、機械学習モデルの評価と訓練に重要です。ただし、これらのデータセットを作成することは困難であり、データの注釈付けには相当な時間、リソース、およびドメインの専門知識が必要です。このデータの最大の影響を最大化することは、関係する研究者と各自の分野の両方にとって重要です。 Hugging Face Hubは、この最大の影響を実現するのに役立ちます。 Hugging Face Hubとは何ですか? Hugging Face…
「トレンドのAI GitHubリポジトリ:2023年10月23日の1週間」
今週のトップ5リポジトリは、新しいリポジトリがトップ5に入るなど、おなじみの顔ぶれが多く見られますこれは完全に珍しいことではありませんが、以前に言及されたリポジトリの再紹介も良いことです彼らの人気は草の根の関心によるものですでは、さあ...
「GitHubツールでデータサイエンスプロジェクトをスーパーチャージングする」
テクノロジーは急速に進化しており、私たちの職場を変革する新しいイノベーションをもたらしています中でも、この進歩によって特に影響を受けているのはデータサイエンティストの役割ですデータサイエンスはすでにエキサイティングな分野ですが、新しいツールによってさらなる次元に進化しています...
「人気コンテストをごまかすためのGitHubのブラックマーケット」
「GitHubでの人気は、開発者やスタートアップにとって貴重なチャンスを提供しますアングラストアではプラットフォーム上で「スター」を売っており、コーダーには、本当に成功するまでそれを偽り続ける方法があります」
トレンディングAI GitHubリポジトリ:2023年10月16日の週
10月16日の週のトップ5のリポジトリを探索する時が来ましたこれらのリポジトリのいくつかは、アプリケーションのビルド速度を向上させることを約束しています他のリポジトリは、オフラインおよびクラウド上でファイルをより良く整理するのを助けることを目指していますそれでは、見てみましょう...
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.