ハギングフェイスがSafeCoderを導入:エンタープライズ向けに構築されたコードアシスタントソリューション

Hanging Face adopts SafeCoder a code assistant solution built for enterprises.

コードアシスタントソリューションは、開発者がコードを書くときや編集するときに支援するツールやソフトウェアアプリケーションです。コードアシスタントソリューションは、その重要性の高さから最近広く利用されています。この分野の進歩のために、実験や研究の取り組みが世界中で行われています。これらのコードアシスタントソリューションはLLMを基に構築されています。GitHub Copilot、TabNine、IntelliCodeなどがその一例であり、これらのソリューションは生産性の向上をもたらします。これらのプラットフォームは、文脈に即したコードの提案や補完を提供することで生産性を大幅に向上させています。その影響はソフトウェア開発プロセスの効率改善に大きく貢献しています。

しかし、これらのコードアシスタントを使用することには問題があります。これらのアシスタントを使用することで、コードベースが第三者に公開される可能性があります。ファインチューニングされたCode LLMは、学習中および推論中にトレーニングデータセットからコードが漏洩する可能性があるため、コードベースは第三者に開示されます。SafeCoderでは、顧客がモデルの作成と更新のプロセスを学び、AIの機能を自社で管理することを可能にします。

そのため、Hugging Faceの研究者はこれらのコードアシスタントソリューションを徹底的に研究し、SafeCoderという方法を提案しました。この方法では、顧客のプライベートなコードベースでモデルをファインチューニングし、最先端のオープンモデルとライブラリを活用します。重要な点は、このプロセスにより、顧客のコードはHugging Faceや外部のエンティティと共有されることはないということです。SafeCoderの基本原則は、顧客の内部コードベースが学習または推論中にいかなる第三者(Hugging Faceを含む)にもアクセスされないことです。コードはトレーニングと推論の間、仮想プライベートクラウド(VPC)内に閉じられ、その完全性が保たれます。

StarCoderは、15兆パラメータを備えた頑強なトレーニングを経ており、コードの最適化技術を組み込んでいます。Flash Attentionの統合により、モデルの効率性がさらに向上し、8,192トークンの文脈を包括することができます。80以上のプログラミング言語でトレーニングされ、複数のベンチマークで最先端のパフォーマンスを提供します。

研究者は、ユーザー固有のコード提案を提供するためのオプションのトレーニングフェーズに取り組みました。Hugging Faceチームは顧客のチームと緊密に協力し、トレーニングデータセットのキュレーションと構築のためのステップバイステップのガイダンスを提供しました。このプロセスは、ファインチューニングを通じてパーソナライズされたコード生成モデルを作成するまで続き、最大限のプライバシーが確保されます。

SafeCoderの展開フェーズでは、顧客はHugging Faceが提供するコンテナを自社のインフラストラクチャに実装することで主導権を握ります。これらのコンテナは、NVIDIA GPU、AMD Instinct GPU、Intel Xeon CPU、AWS Inferentia2、Habana Gaudiアクセラレータなどのオプションを含め、顧客の特定のハードウェアセットアップに合わせて設定されます。SafeCoderのエンドポイントを顧客のVPC内に展開し、有効化すると、開発者は対応するSafeCoder IDEプラグインを統合することができます。この統合により、開発者は作業中にリアルタイムのコード提案を受け取ることができます。

将来的には、SafeCoderは商業的に許可される他のオープンソースモデルを提供するかもしれません。これらのモデルは、倫理的に信頼性のあるデータセットを基にしており、ファインチューニングに使用できる基本的なLLMとして利用できます。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

バイトダンスの研究者が「ImageDream」を紹介:3Dオブジェクト生成のための画像刺激とマルチビューディフュージョンモデルの革新的な導入

諺にあるように、「一枚の画像は千語の価値がある」ということわざは、3D制作に画像を第二の手段として追加することで、テキ...

AIニュース

海洋ナビゲーションのためのロボットプラットフォームを構築するために、カイアシ類が泳ぐ方法を模倣する

ブラウン大学とメキシコ国立自治大学の研究者たちは、水中を航行するためにメタクロナル泳法を模倣したロボットプラットフォ...

AI研究

このAI研究は、ポイントクラウドを2D画像、言語、音声、およびビデオと一致させる3Dマルチモダリティモデルである「Point-Bind」を紹介します

現在の技術的な景観では、3Dビジョンが急速な成長と進化により注目を浴びています。この関心の高まりは、自動運転、強化され...

機械学習

「いや、いや、そこには置かないで!このAIメソッドは拡散モデルを使って連続的なレイアウト編集が可能です」

この時点で、テキストから画像への変換モデルは誰もが馴染んでいます。昨年の安定した拡散のリリースと共に登場し、それ以来...

機械学習

「OpenAI Dev Day 2023 創設者サム・オルトマンの基調講演からの4つの重要発表、見逃せません!」

「OpenAIによって初めて開催されたデベロッパーカンファレンスは、素晴らしい製品発表で満員御礼でしたさらに興味深いことに...

コンピュータサイエンス

「生成AI」の「スーパーユーザー」に出会ってください:Gen Zの70%がGenAIを使用しています

Salesforceの調査によると、年齢と雇用状況はAIの導入における主要な要素です