Search Results こちらをご覧ください

Google Gemini APIを使用してLLMモデルを構築する

導入 ChatGPTとOpenAIのGPTモデルのリリース、およびMicrosoftとのパートナーシップにより、AIの領域にTransformerモデルをもたらしたGoogleはみんなが諦めた存在となりました。 GPTモデルがリリースされてから1年以上が経過しましたが、GoogleからはPaLM API以外に大きな動きはありませんでした。PaLM APIもあまり注目されず失敗に終わりました。そしてGoogleが突如として紹介した基盤となるモデルのグループ、Geminiが登場しました。Geminiの発売からわずか数日後、GoogleはGemini APIをリリースしました。このガイドでは、Gemini APIをテストし、最終的にはそれを使用してシンプルなチャットボットを作成します。学習目標 GoogleのGeminiシリーズの基礎知識を学ぶ。これには異なるモデル（Ultra、Pro、Nano）と、テキストと画像のサポートを中心とする多様性が含まれます。 Gemini Proのチャット・モデルを使用してチャットベースのアプリケーションを作成するスキルを開発し、チャットの履歴を維持し、ユーザーの文脈に基づいて応答を生成する方法を理解する。 Geminiが安全であるために、不安全なクエリを処理し、さまざまなカテゴリの安全性評価を提供することにより、責任あるAIの使用を保証する方法を探索する。 Gemini ProとGemini Pro Visionモデルを使用した実践的な経験を積み、画像の解釈と説明を含む、テキスト生成とビジョンに基づく機能を探索する。 Gemini APIとLangchainを統合して、相互作用のプロセスを簡素化する方法を学び、複数のクエリを効率的に処理するための入力と応答のバッチ処理について学ぶ。この記事はデータサイエンスブログサラソンの一部として公開されました。 Geminiとは何ですか？ Geminiは、Googleが構築し導入した新しい基盤モデルのシリーズです。これはこれまでのPaLMと比べて最も大きなモデルセットであり、最初から多様性に焦点を当てて構築されています。これにより、Geminiモデルはテキスト、画像、オーディオ、ビデオなどの異なる情報タイプの組み合わせに強力です。現在、APIは画像とテキストのサポートを提供しています。Geminiは、ベンチマークで最先端のパフォーマンスを達成し、多くのテストでChatGPTとGPT4-Visionモデルを上回っています。 Geminiには、サイズに基づいて3つの異なるモデルがあります。サイズの順に、Gemini Ultra、Gemini Pro、Gemini…

デルタテーブルの削除ベクトル：Databricksの操作のスピードアップ

伝統的に、Delta Lakeはコピーオンワイトのパラダイムのみをサポートしており、元のデータファイルは書き込まれるたびに変更されます例：ファイル内の1行が削除されると、...

「Satya Mallickと一緒にコンピュータビジョンの問題を解決する」

Leading with Dataのこのエピソードでは、OpenCV.orgのCEOであり、Big Vision LLCの創設者でもあるSatya Mallickさんとお話しします。Satyaは、コンピュータビジョンの興味深い旅を共有し、画像処理とコンピュータビジョンの重要な違いについて強調しています。AIコンサルティングにおける透明性から戦略的成長戦略、ジェネレーティブAIの変革的な影響まで、Satyaは専門家や愛好家にとって貴重な視点を提供しています。ダイナミックなAIとデータサイエンスの分野で成功の秘密を解き明かす準備をしてください。 Spotify、Google Podcasts、およびAppleなどの人気プラットフォームでLeading with Dataのエピソードを聴くことができます。お気に入りを選んで、洞察に富んだ内容をお楽しみください！ Satya Mallickさんとの会話からの主要なインサイト画像処理とコンピュータビジョンの違いは重要です – 画像の強化だけでなく、情報を抽出することに関わっています。透明性と返金保証は、AIコンサルティングにおいて信頼性と信用性を構築することができます。戦略的パートナーシップと機会の把握は、コンサルティングビジネスの成長に不可欠です。ジェネレーティブAIは生産性を大幅に向上させ、複雑なタスクの自動化を可能にします。態度と学習意欲を求める採用は、経験豊富なプロフェッショナルと競争するよりも、より有益になる場合があります。 AI業界は大きなブレイクスルーの目前にあり、今参加する人々にとって非常に大きな機会を提供しています。 AIおよびデータサイエンスのリーダーとの洞察に満ちたディスカッションのため、今後のLeading with Dataのセッションに参加しましょう！…

ハグ顔（Hugging Face）での最新技術の組み合わせであるミクストラル（Mixtral）へようこそ

Mixtral 8x7bは、ミストラルが本日リリースした刺激的な大型言語モデルで、オープンアクセスモデルの最新技術基準を上回り、多くのベンチマークでGPT-3.5を凌駕しています。私たちは、MixtralをHugging Faceエコシステムに包括的に統合してのローンチをサポートすることに興奮しています🔥！本日リリースされる機能と統合には以下があります：ハブ上のモデル、モデルカードとライセンス（Apache 2.0） 🤗 Transformers統合推論エンドポイントとの統合高速で効率的な本番推論のためのテキスト生成推論との統合 🤗 TRLを使用した単一のGPUでのMixtralの微調整の例目次 Mixtral 8x7bとは何ですか名前についてプロンプト形式分からないことデモ推論 🤗 Transformersを使用するテキスト生成推論を使用する 🤗…

データのアルトリズム：企業エンジンのデジタル燃料

デジタル経済は、知識と情報への均等で迅速かつ無料のアクセスという素晴らしい約束に基づいて構築されてきましたそれから長い時間が経ちましたそして約束された平等の代わりに、私たちがするのは...

「ビジュアルAIがカナダ最大かつ最も賑やかな空港で飛躍する」

カナダのオンタリオ州にあるトロントピアソン国際空港は、年間約5000万人の旅客にサービスを提供する国内最大かつ最も混雑した空港です。旅行者の体験を向上させるために、同空港は2022年6月にZensors AIプラットフォームを導入しました。このプラットフォームは、既存のセキュリティカメラの匿名映像を使用して空間データを生成し、リアルタイムで運用を最適化するのに役立ちます。 NVIDIA MetropolisのビジョンAIパートナーエコシステムの一員であるZensorsは、トロントピアソンの運用チームが通関待ち時間を大幅に短縮しました。2022年のピーク時に到着手続きにかかる平均時間は30分程度と推定されていたものが、昨年の夏にはわずか6分未満に減少しました。同社の共同創業者であるAnuraag Jain氏は、「Zensorsは視覚AIを誰でも簡単に使用できるようにしています。」と述べています。 Jain氏はさらに、大規模なAIのスケーリングはほとんどの組織にとって容易ではないと付け加え、空港は従来のハードウェアセンサーやLiDAR、3Dステレオカメラに基づく効果の薄い解決策に頼るか、改装や新しいターミナルの建設によって運用を改善することを考えることが多いと述べています。これらの方法は数十億ドルのプロジェクトになり得ます。 Jain氏は、「当社は、既存のカメラと最新のAI技術を使用して、空港がソフトウェア企業のように考えることができるプラットフォームを提供しています。それにより、より迅速でコスト効果の高い、さらに正確なソリューションを展開することが可能になります。」と述べています。空港運用の高速化トロントピアソンでは、ターミナルのインフラをアップグレードするか新たに建設する通常の数か月または数年かかる作業ではなく、数週間で運用を改善する方法が必要でした。 Zensors AIプラットフォームは、空港の既存のカメラシステムからの映像フィードを構造化データに変換します。匿名化された映像を使用して、プラットフォームは待ち列の旅行者数をカウントし、混雑したエリアを特定し、パッセンジャーの待ち時間を予測するなどのタスクを実行し、リアルタイムでスタッフに通知して運用を迅速化します。このプラットフォームはまた、運用チームがパフォーマンスを評価し、より効果的に計画し、最適な効率性のためにスタッフを再配置するための分析レポートも提供します。 Zensors AIによるリアルタイムの待ち時間統計データは、トロントピアソンのオンラインダッシュボードおよびターミナル内の電子ディスプレイに公開されます。これにより、旅客は関税手続きやセキュリティ手続きにかかる時間について正確な情報に簡単にアクセスできます。また、全体的な顧客満足度を向上させ、接続便に乗ることができるかどうかについての潜在的な不安を軽減します。トロントピアソンの運営会社であるGreater Toronto Airport Authorityの空港IT計画開発ディレクターであるZeljko Cakic氏は、「Zensorsプラットフォームから得られる分析は非常に正確であることがわかっています。全体的な顧客体験を向上させ、待ち時間を短縮することを目指しており、Zensorsプラットフォームを通じて収集されるデータはこの結果を推進する意思決定のための主要な要素の一つです。」と述べています。 NVIDIAによる高精度AI Zensors…

SetFitABSA SetFitを使用したFew-Shotアスペクトベースの感情分析

SetFitABSAは、テキスト内の特定の側面に対する感情を検出する効率的な技術です。 Aspect-Based Sentiment Analysis (ABSA)は、テキスト内の特定の側面に対する感情を検出するタスクです。例えば、「この電話は画面が素晴らしいですが、バッテリーは小さすぎます」という文では、側面の用語は「画面」と「バッテリー」であり、それぞれに対する感情極性はPositiveとNegativeです。 ABSAは、さまざまなドメインの製品やサービスの顧客フィードバックを分析して貴重な情報を抽出するために、組織によって広く使用されています。しかし、ABSAのためのラベル付けトレーニングデータは、トレーニングサンプル内で側面を手動で細かく識別する必要があるため、手間のかかる作業です。 Intel LabsとHugging Faceは、ドメイン固有のABSAモデルのfew-shotトレーニングのためのフレームワークであるSetFitABSAを紹介しています。SetFitABSAは、few-shotシナリオでLlama2やT5などの生成モデルに比べて競争力があり、さらに優れた性能を発揮します。 LLMベースの手法と比較して、SetFitABSAには次の2つのユニークな利点があります: 🗣 プロンプトが不要です: LLMを使ったfew-shot in-context学習では、結果がもろくなり、表現に敏感になり、ユーザーの専門知識に依存する手作りのプロンプトが必要です。SetFitABSAは、ラベル付けされた少数のテキスト例から直接豊かな埋め込みを生成することで、プロンプトを完全に不要とします。 🏎 高速トレーニング: SetFitABSAは、わずかなラベル付きトレーニングサンプルのみを必要とします。さらに、専門のタグ付けツールを必要としないシンプルなトレーニングデータ形式を使用します。これにより、データのラベリングプロセスが迅速かつ容易になります。このブログ記事では、SetFitABSAの動作方法と、SetFitライブラリを使用して独自のモデルをトレーニングする方法を説明します。では、さっそく見ていきましょう！どのように機能しますか？ SetFitABSAの3つのステージからなるトレーニングプロセス SetFitABSAは3つのステップで構成されています。第1ステップでは、テキストから側面候補を抽出し、第2ステップでは、側面候補を側面または非側面として分類し、最終ステップでは抽出された各側面に感情極性を関連付けます。第2ステップと第3ステップはSetFitモデルに基づいています。トレーニング 1. 側面候補の抽出…

『Janne Aas-Jakobsen、CONSIGLI ASの創業者兼CEO – AIのエンジニアリングと建設への役割、持続可能な技術、グローバル拡大、起業家の洞察、技術革新』

私たちのインタビューで、CONSIGLI ASの創設者兼CEOであるヤンネ・アース・ヤコブセンさんと共に、AIがエンジニアリングと建設業界で果たす変革的な役割について掘り下げています伝統的な産業にAIを統合するパイオニアであるヤンネさんは、この技術が持続可能性と効率性を向上させる方法について語りますまた、グローバルな拡大戦略や起業家にとって重要な洞察にも踏み込んでいます...　文章の長さを超過しましたので、省略しますコンシーリ AS の創設者兼CEO、エンジニアリングと建設業界におけるAIの役割、持続可能な技術、グローバルな拡大、起業家の洞察、技術革新について、詳しくはこちらをご覧ください

「RetinaNetとKerasCVを使用した物体検出」

画像セグメンテーションをベースにしたミニプロジェクトを終えた後（こちらをご覧ください）、コンピュータビジョンの一環として、別の一般的なタスクに取り掛かる準備ができました：オブジェクト検出ですオブジェクト検出とは...

『Re Invent 2023の私のお勧め』

ここに私のお気に入りのリストがありますが、特定の順序はありません (Koko ni watashi no okiniiri no risuto ga arimasu ga, tokutei no junjo wa arimasen.)

Learn more about Search Results こちらをご覧ください