Search Results A

ビッグテックに対抗するためのAIスタートアップの3つの戦略

「堅守可能な企業を構築することは、特に生成型AIの出現により、以前よりも困難になっていますビッグテックは、配信と競争力のある価格設定の両方でスタートアップに対して固有の利点を持っていますどんなスタートアップの創業者でも悪夢のシナリオを知っています：競合する新しい機能や製品を提供するために、自分の領域に大企業が登場することですしかも、それは無料ですそして、それをバンドルしています...」

「Auto-GPT＆GPT-Engineer：今日の主要なAIエージェントについての詳細ガイド」

「ChatGPTとAuto-GPT＆GPT-Engineerなどの自律型AIエージェントの包括的な分析に没入してください機能、セットアップガイドを探索し、労働市場への影響を理解してください」

「企業がGoogle Cloud AIを利用する7つの方法」

「Google Cloud Next 2023では、数千人がサンフランシスコに集まり、Google Cloudの最新アップデートについて学びました」

AudioLDM 2は、Haohe Liuらによる「AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining」で提案されました。AudioLDM 2は、テキストプロンプトを入力として受け取り、対応するオーディオを予測します。リアルな音効、人の声、音楽を生成することができます。生成されるオーディオは高品質ですが、元の実装での推論の実行は非常に遅いです。10秒のオーディオサンプルを生成するのに30秒以上かかります。これは、深いマルチステージのモデリングアプローチ、大きなチェックポイントサイズ、最適化されていないコードなど、複数の要素の組み合わせによるものです。このブログ記事では、Hugging Faceの🧨 Diffusersライブラリを使用してAudioLDM 2を使用する方法を紹介し、半精度、フラッシュアテンション、コンパイルなどのコードの最適化、スケジューラの選択、ネガティブプロンプティングなどのモデルの最適化を探求します。その結果、推論時間を10倍以上短縮でき、出力オーディオの品質の低下は最小限です。ブログ記事には、コードはすべて含まれていますが、説明は少なめです。最後まで読んでください。わずか1秒で10秒のオーディオサンプルを生成する方法がわかります！モデルの概要 Stable Diffusionに触発され、AudioLDM 2はテキストからオーディオへの潜在的な拡散モデル（LDM）であり、テキストの埋め込みから連続的なオーディオ表現を学習します。全体の生成プロセスは以下のように要約されます：テキスト入力x\boldsymbol{x}xを与えると、2つのテキストエンコーダーモデルが使用され、テキストの埋め込みが計算されます：CLAPのテキストブランチとFlan-T5のテキストエンコーダー…

「IoT企業のインテリジェントビデオアナリティクスプラットフォームを搭載したAIがベンガルール空港に到着」

毎年、約3200万人がベンガルール空港、またはBLRを通過し、世界で最も人口の多い国の中で最も忙しい空港の一つです。このような多くの人々により安全で迅速な体験を提供するために、かつてバンガロールとして知られていた都市の空港は、Industry.AIが提供するビジョンAI技術を活用しています。 NVIDIA MetropolisビジョンAIパートナーエコシステムの一員であるIndustry.AIは、BLRの最新ターミナルであるT2、またの名をガーデンターミナルとも呼ばれるターミナルに、ビジョンAIプラットフォームを展開しています。このターミナルは、緑地、屋内庭園、滝で知られています。これは、インドの空港で大規模なインテリジェントビデオ解析の展開の一つです。 BLRの最新ターミナルの緑地。 Industry.AIは、ビジョンAIと物体検出を使用して、放置された荷物の追跡、長い乗客の列、潜在的な問題に対するセキュリティチームへのアラートなど、ターミナルの運用の安全性と効率性を向上させるために活用されています。ビジョンAIによる混雑ポイントの特定と遅延の予測により、スタッフは積極的に乗客を混雑していないエリアに誘導したり、追加のチェックポイントを開くための信号を提供したりすることができ、待ち時間を短縮し、乗客の体験を向上させることができます。 BLRの親会社の最高情報責任者であるジョージ・ファンサム氏は、「このようなスケールでビジョンAIを展開するのは初めてです。」と述べています。「このような先進的なディープラーニング技術を採用することで、世界で最も優れた空港の一つになり、顧客に最高の体験を提供したいと考えています。」よりスマートで安全な空港運営 Industry.AIプラットフォームは、BLRターミナル全体の500以上のライブカメラフィードをビジョンAI技術に接続し、リアルタイムでほぼ12のタスクを達成することができます。例えば、プラットフォームは荷物や財布が放置されていることを検知することができます。また、ターミナルの入口、チェックインカウンター、セキュリティチェックレーンなどでの乗客の列を管理するのにも役立ちます。空港スタッフは、AIプラットフォームによって収集された乗客の移動の過去のデータに基づいて、積極的にタスクを実行するようにトレーニングすることができます。 Industry.AIのCEOであるテージプリート・チョープラ氏は、「当社のプラットフォームは、ピーク時の乗客フローを加速し、空港スタッフに長すぎる列についてアラートを出すことで、最適な時間で対応することができます。」と述べています。「これは、リアルタイムのビジュアルとセンサーフィードを備えたダッシュボードを通じて行われます。」空港内での未承認の人物や車両も、リアルタイムで追跡され、プラットフォームのユーザーにアラートが送られ、セキュリティが強化されます。さらに、Industry.AIは、ターミナル外での車両による速度違反も検知し、旅行ハブ周辺の安全な輸送を管理するのに役立ちます。 AIがBLR内外の輸送を管理するのに役立ちます。 Industry.AIは、AIモデルのトレーニングにNVIDIA TAO ToolkitとA100 Tensor Core GPUを使用しています。AI推論には、NVIDIA Triton Inference ServerとA30…

「AIの誤情報：なぜそれが機能するのか、そしてそれを見抜く方法」

オンライン上で何が本物かを判断することはますます困難になっていますしかし、それに対処するために取ることができる手段があります

スマートインフラストラクチャのリスク評価における人間とAI・MLの協力

「人間の専門知識、AIの洞察、およびMLアルゴリズムをシナジー効果を発揮させることで、より安全で適応性のある都市システムのためのスマートインフラリスク評価が変革されます」

ODSC APAC 2023はオンデマンドで視聴可能になりました

先週、世界中から集まった何千人ものデータサイエンティストがODSC APAC Virtualで学び、成長し、つながるために集まりました今回のカンファレンスが終了したので、トップセッションのいくつかをオンデマンドで共有することを楽しみにしています以下でチェックしてくださいレコメンダーシステムを活用して最大限の効果を発揮する...

APAC 2023

Googleが「Gemini」というAIツールと、その他多数のAIツールをリリースしました

「Googleは、サンフランシスコで開催されたGoogle Nextカンファレンスでの最新発表において、幅広い新しいAI技術やパートナーシップを明らかにしましたOpenAIやMicrosoftによる最近の進展に直接対抗するために設計されたように見えるGoogleのイノベーションの連続は、AIの領域における積極的な再配置を示していますGoogleのフラッグシップ[…]」

google

「Jais アラビア語-英語の大規模言語モデルにおける大きな飛躍」

ニューヨーク、NY — 2023年8月30日：共同の取り組みで、Inception、G42の会社、人工知能のモハメド・ビン・ザイード大学（MBZUAI）、世界初の大学院レベルのAI研究...

Learn more about Search Results A - Page 256