Search Results リポジトリ

5分であなたのStreamlitウェブアプリを展開してください

データサイエンティストが自分の仕事をダッシュボードや動作するWebアプリで紹介する必要性が高まってきていますWebアプリを作成するための利用可能なツールを知っておくことは非常に便利です利用可能なツールはたくさんあります...

「ChatGPTを使用してデータサイエンスのポートフォリオウェブサイトを作成する方法」

エントリーレベルのデータサイエンティストとして、競争が最高潮にあるため、業界に参入することは困難かもしれません特に学位や正式な経験がない場合、これは特に当てはまります...

「Azure Machine Learningによる機械学習オペレーション（MLOps）」

Machine Learning Operations（MLOps）は、データサイエンティストとMLエンジニアが組織のニーズに対応するスピードを大幅に加速させることができます適切に実装されたMLOpsプロセスは、テストから本番環境への移行を迅速化するだけでなく、チーム内で使用されるMLアーティファクトに関する所有権、系譜、および過去のデータを提供しますデータサイエンスチームは今...

LangChainとLLMsのための非同期処理

「この記事では、LangChainを使用してLLMに非同期呼び出しを行い、長いワークフローを処理する方法について説明します実際のコードを使用した例を通じて、順次実行と比較しながら進めます...」

「PolarsによるEDA：集計と分析関数のステップバイステップガイド（パート2）」

このシリーズの最初のパートでは、Polarsの基礎をカバーし、その機能と構文をPandasと比較しましたこのパートでは、クエリの複雑さをさらに一歩進めますので、...

ChatGPT コードインタプリター：私が何時間もの作業を節約した方法

2023年7月6日、OpenAIは、Code Interpreterが次の週にChatGPT Plusユーザーに利用可能になることを発表しましたこれは、パワーと機能を向上させる最も優れたプラグインの一つかもしれません...

「責任あるAIダッシュボードでオブジェクト検出モデルをデバッグする」

「Microsoft Build 2023 において、Azure Machine Learning の責任ある AI ダッシュボードでテキストと画像データのサポートをプレビューで発表しましたこのブログでは、ダッシュボードの新しいビジョンインサイト機能に焦点を当て、オブジェクト検出モデルのデバッグ機能をサポートしますまた、今後の投稿ではテキストベースのシナリオにも取り組みます...」

「現代の大規模言語モデル（LLM）は素晴らしい能力を持っていますが、複雑なワークフローやシステムに統合することは困難であり、信頼性の低い結果や不必要なコードの重複を引き起こすことがありますNormal ComputingのRémi Loufによって作成されたOutlinesは、これらの問題に対する解決策を提供しますOutlinesを使用することで、より信頼性の高いLLMの構築が可能になります...」

なぜAIが2023年のトップ開発者スキルとなったのか

AIの急速な普及に伴い、それは急速に開発において重要な役割を果たし始めていますAIによって、開発者は簡単で時間のかかるタスクを自動化し、将来のトレンドを予測し、プロセスを最適化することができますAIが開発者を支援する別の側面は、AIツールがどのように...

「TransformersとTokenizersを使用して、ゼロから新しい言語モデルを訓練する方法」

ここ数か月間で、私たちはtransformersとtokenizersライブラリにいくつかの改良を加え、新しい言語モデルをゼロからトレーニングすることをこれまで以上に簡単にすることを目指しました。この記事では、”小さな”モデル（84 Mパラメータ = 6層、768隠れユニット、12アテンションヘッド）を「エスペラント」でトレーニングする方法をデモンストレーションします。その後、モデルを品詞タグ付けの下流タスクでファインチューニングします。エスペラントは学習しやすいことを目標とした人工言語です。このデモンストレーションのために選んだ理由は以下のとおりです：比較的リソースが少ない言語です（約200万人が話すにもかかわらず）、このデモンストレーションはもう1つの英語モデルのトレーニングよりも面白くなります 😁 文法が非常に規則的です（例：一般的な名詞は-oで終わり、すべての形容詞は-aで終わります）。そのため、小さなデータセットでも興味深い言語的結果が得られるはずです。最後に、この言語の基盤となる目標は人々をより近づけることです（世界平和と国際理解を促進すること）。これはNLPコミュニティの目標と一致していると言えるでしょう 💚 注：この記事を理解するためにはエスペラントを理解する必要はありませんが、学びたい場合はDuolingoには280,000人のアクティブな学習者がいる素敵なコースがあります。私たちのモデルの名前は…待ってください…EsperBERTo 😂 1. データセットを見つけるまず、エスペラントのテキストコーパスを見つけましょう。ここでは、INRIAのOSCARコーパスのエスペラント部分を使用します。OSCARは、WebのCommon Crawlダンプの言語分類とフィルタリングによって得られた巨大な多言語コーパスです。データセットのエスペラント部分はわずか299Mですので、Leipzig Corpora Collectionのエスペラントサブコーパスと連結します。このサブコーパスには、ニュース、文学、ウィキペディアなど様々なソースのテキストが含まれています。最終的なトレーニングコーパスのサイズは3 GBですが、モデルに先行学習するためのデータが多ければ多いほど、より良い結果が得られます。 2.…

Learn more about Search Results リポジトリ - Page 72