Learn more about Search Results 提供しています - Page 13
- You may be interested
- ミストラルAIは、パワフルなスパースな専...
- 「Raspberry Piは音を使って目に見えない...
- 「ラズベリーシェイクで地震を検知」
- リーンで、意味ありげなAI夢マシン:DejaV...
- 「Deep Diving Into Llama 2 メタAIの新し...
- このAI研究は、単一の画像を探索可能な3D...
- 「不正行為の恐れにもかかわらず、学校はC...
- 「社会教育指数は学校卒業者の結果にどの...
- 「研究者たちが、チップベースのサーミオ...
- AIと資金調達:資金調達には人間の要素が...
- マイクロソフトが「TypeChat」をリリース...
- 「LlamaIndex vs LangChain 比較分析」
- 予想外な方法でAIがイスラエル・ハマス戦...
- トレンドのAI GitHubリポジトリ:2023年11...
- 「GPUのマスタリング:PythonでのGPUアク...
「ビジュアルAIがカナダ最大かつ最も賑やかな空港で飛躍する」
カナダのオンタリオ州にあるトロントピアソン国際空港は、年間約5000万人の旅客にサービスを提供する国内最大かつ最も混雑した空港です。 旅行者の体験を向上させるために、同空港は2022年6月にZensors AIプラットフォームを導入しました。このプラットフォームは、既存のセキュリティカメラの匿名映像を使用して空間データを生成し、リアルタイムで運用を最適化するのに役立ちます。 NVIDIA MetropolisのビジョンAIパートナーエコシステムの一員であるZensorsは、トロントピアソンの運用チームが通関待ち時間を大幅に短縮しました。2022年のピーク時に到着手続きにかかる平均時間は30分程度と推定されていたものが、昨年の夏にはわずか6分未満に減少しました。 同社の共同創業者であるAnuraag Jain氏は、「Zensorsは視覚AIを誰でも簡単に使用できるようにしています。」と述べています。 Jain氏はさらに、大規模なAIのスケーリングはほとんどの組織にとって容易ではないと付け加え、空港は従来のハードウェアセンサーやLiDAR、3Dステレオカメラに基づく効果の薄い解決策に頼るか、改装や新しいターミナルの建設によって運用を改善することを考えることが多いと述べています。これらの方法は数十億ドルのプロジェクトになり得ます。 Jain氏は、「当社は、既存のカメラと最新のAI技術を使用して、空港がソフトウェア企業のように考えることができるプラットフォームを提供しています。それにより、より迅速でコスト効果の高い、さらに正確なソリューションを展開することが可能になります。」と述べています。 空港運用の高速化 トロントピアソンでは、ターミナルのインフラをアップグレードするか新たに建設する通常の数か月または数年かかる作業ではなく、数週間で運用を改善する方法が必要でした。 Zensors AIプラットフォームは、空港の既存のカメラシステムからの映像フィードを構造化データに変換します。 匿名化された映像を使用して、プラットフォームは待ち列の旅行者数をカウントし、混雑したエリアを特定し、パッセンジャーの待ち時間を予測するなどのタスクを実行し、リアルタイムでスタッフに通知して運用を迅速化します。 このプラットフォームはまた、運用チームがパフォーマンスを評価し、より効果的に計画し、最適な効率性のためにスタッフを再配置するための分析レポートも提供します。 Zensors AIによるリアルタイムの待ち時間統計データは、トロントピアソンのオンラインダッシュボードおよびターミナル内の電子ディスプレイに公開されます。これにより、旅客は関税手続きやセキュリティ手続きにかかる時間について正確な情報に簡単にアクセスできます。また、全体的な顧客満足度を向上させ、接続便に乗ることができるかどうかについての潜在的な不安を軽減します。 トロントピアソンの運営会社であるGreater Toronto Airport Authorityの空港IT計画開発ディレクターであるZeljko Cakic氏は、「Zensorsプラットフォームから得られる分析は非常に正確であることがわかっています。全体的な顧客体験を向上させ、待ち時間を短縮することを目指しており、Zensorsプラットフォームを通じて収集されるデータはこの結果を推進する意思決定のための主要な要素の一つです。」と述べています。 NVIDIAによる高精度AI Zensors…
「MITとAdobeの研究者が、一つのステップの画像生成器に拡散モデルを変換するための人工知能手法、Distribution Matching Distillation (DMD 分布マッチング蒸留) を紹介」
一定のトレーニングプロセスを経て、拡散モデルは画像生成を革新し、従来にない多様性とリアリズムのレベルを達成しました。しかし、GANやVAEとは異なり、そのサンプリングはガウス性ノイズのサンプルのノイズを徐々に減少させ、プログレッシブなデノイジングにより複雑な画像を生成する努力の連続的なプロセスです。これにより、生成パイプラインをクリエイティブなツールとして利用する際の相互作用の量が制限され、通常は多くの高価なニューラルネットワーク評価を必要とします。以前の手法は、初めの多段階の拡散サンプリングで見つかったノイズ→画像のマッピングを単回の学習ネットワークに濃縮し、サンプリングプロセスを高速化します。こうした高次元で複雑なマッピングをフィットすることは、確かに困難な作業です。 改良の余地の一つは、学習モデル全体のデノイジング経路を実行し、単一の損失を計算するための学習モデルのサンプル距離を徐々に拡大していく際に発生する高額な費用です。現在の手法は、元の多段階拡散モデルのデノイジングサイクルを繰り返さずに、学生のサンプル距離を徐々に拡張することでこれを軽減しています。ただし、元の多段階拡散モデルの方が蒸留版よりも優れています。逆に、研究チームは、ノイズと拡散生成された画像の対応を必要とせずに、学生の生成物が元の拡散モデルと同じであることを強調しています。一般的には、彼らの目標の理論的背景は、他の分布マッチング生成モデル(GMMNやGANなど)と似ています。 ただし、リアルなグラフィックを生成する能力は非常に優れているにもかかわらず、一般的なテキストから画像へのモデルのスケーリングは困難であることがわかっています。研究チームは、この問題を解決するために、以前にテキストから画像に広範にトレーニングされた拡散モデルを起点にしています。研究チームは、トレーニングされた拡散モデルを特に微調整することで、データ分布とそれによって生成される架空の分布を学びます。研究チームは、デノイズされた拡散出力を画像を「よりリアル」または(拡散モデルが偽の画像でトレーニングされている場合)「よりフェイク」にするための勾配方向として解釈することができます。なぜなら、拡散モデルは拡散分布のスコア関数を近似することで知られているからです。 最終的に、ジェネレータの勾配更新ルールは、この2つの差として作成され、人工の画像をよりリアリスティックに、よりフェイクから遠ざけます。また、事前学習された拡散モデルによるリアルと偽の分布のモデリングを使用して3Dオブジェクトのテスト時最適化を達成することも可能です。以前の研究では、Variational Score Distillationという手法を使用してこれを実証しています。研究チームは、同様の手法を使用して完全な生成モデルをトレーニングできることも発見しています。さらに、研究チームは、分布マッチング損失の存在下で、多段階拡散サンプリングの結果のわずかな数が事前計算され、1ステップの生成に関するシンプルな回帰損失を実装することで効果的な正則化子として機能することを見つけています。 MITとAdobe Researchの研究者は、Distribution Matching Distillation(DMD)と呼ばれるプロセスを提供しています。これは、画像の品質にほとんど影響を与えずに拡散モデルを1ステップの画像生成器に変換するプロセスです。彼らのアプローチは、VSD、GAN、およびpix2pixからのインスピレーションや洞察を受けています。この研究チームは、(1) 拡散モデルを使用してリアルな分布とフェイクの分布をモデル化し、(2) 多段階拡散出力とシンプルな回帰損失を一致させることで、高精度の1ステップ生成モデルをトレーニングすることができることを示しています。彼らのDistribution Matching Distillation(DMD)技術でトレーニングされたモデルをMS COCO 512×512のゼロショットテキストから画像の生成、CIFAR-10およびImageNet 64×64の画像生成など、さまざまなタスクで評価しています。彼らの1ステップジェネレータは、一括生成モデル、進行的ディスティレーション、修正フローなどの全てのベンチマークで、既知の少数ステップ拡散手法よりも優れたパフォーマンスを発揮します。 DMDはImageNetでのFIDが2.62であり、Consistency Modelを2.4倍上回ります。DMDはStable Diffusionと同じデノイザーアーキテクチャを使用して、MS-COCO 2014-30kで11.49の競争力のあるFIDを達成します。彼らの定量的および定性的な分析は、研究チームのモデルで生成される画像がより高度な品質であり、より高価なStable Diffusionモデルで生成されるものと比較できることを示しています。特に、このレベルの視覚品質を保ちながら、ニューラルネットワークの評価数を100倍減少させることができるという点で、その効率性によって、DMDはFP16推論を使用することで秒間20フレームの速度で512×512の画像を生成できるようになり、多くのインタラクティブなアプリケーションの可能性を開拓しています。
言語モデルを使用したドキュメントの自動要約のテクニック
要約は、大量の情報をコンパクトで意味のある形式に短縮する技術であり、情報豊かな時代における効果的なコミュニケーションの基盤となっていますデータの溢れる世界で、長いテキストを短い要約にまとめることで時間を節約し、的確な意思決定を支援します要約は内容を短縮して提示することにより、時間を節約し、明確さを向上させる役割を果たします
成功の鍵を開ける:IBM Watsonがあなたのビジネスを革命する方法
「IBM WatsonのAIが、さまざまな業界でビジネスを変革し、データに基づいた意思決定、効率化された業務、充実した顧客体験、カスタマイズされたソリューションを可能にする方法を探求してください Watsonの革新について学び、導入方法や将来の対策に必要な倫理的な考慮事項について貴重な見識を得てください」
トップのAIメールアシスタント(2023年12月)
人工知能のメールアシスタントは、メールの作成をスムーズかつ簡単にするためのツールです。自動的なタスク補完、メッセージの優先順位付け、そして即座で洞察に富んだ回答によって、AIのメールアシスタントはあなたの受信箱の管理の負担を軽減する方法です。その結果、ユーザーは最も重要なメールに集中して、より短い時間でより多くの作業を行うことができます。AIによって動作する自動化されたメールヘルパーは、あなたの代わりにメッセージを書いたり送ったりすることもできます。 様々な職業の人々-多忙なオフィス労働者や企業オーナー、個人事業主や学生など-が人工知能とメールヘルパーを利用しています。AIのメールアシスタントは、スケジュールの詰まったプロフェッショナルが受信箱を管理し、重要なメッセージを見逃さないための素晴らしいツールです。AIのメールアシスタントは、起業家や企業オーナーにとって時間と労力を節約するツールです。AIのメールアシスタントを使用することは、学生が組織的に保ち、教授との連絡を取るための素晴らしい方法です。 この記事では、いくつかの人気のあるAIメールアシスタントを比較します。 SaneBox SaneBoxのAIは重要なメールを識別し、他のメールを自動的に整理して集中力を高めるためのお手伝いをします。SaneBoxは、インテリジェントなAIアルゴリズムを使用してあなたのメールの振る舞いを分析します。過去のやり取りから学び、重要なメールを識別し、重要でないメッセージを別のフォルダに移動し、ニュースレターやソーシャルメディアの通知をまとめます。要するに、混沌を秩序に変え、デジタルなやりとりを効率化します。 InboxPro AIと強力な自動化ツールを使用してGmailの生産性を向上させましょう。InboxProは、営業や顧客サポートをよりスムーズにするオールインワンのソリューションです。 Lavender Lavenderは、AIで動作するメールアシスタントであり、世界中の数千の小売業者が電子メールを通じて顧客に対する品質と速度を向上させるのに役立っています。Lavenderはパブリックの広告会社ではなく、プライベートの会社です。クッキーによって動作し、ウェブサイトの機能を向上させることができます。ログインのセキュリティ確保や同意設定のカスタマイズなど、基本的な機能はクッキーに依存しています。ソーシャルメディアの共有、フィードバックの収集、その他の第三者の統合は、機能クッキーに頼って正しく動作します。解析クッキーは訪問回数、跳ね返り率、トラフィックソースなどのデータを収集し、ウェブサイトのユーザーの行動を把握するために使用されます。 Missive Missiveは、チームを組織するためのいくつかの便利なツールを備えた賢明なメールヘルパーです。最近、OpenAIのGPTテクノロジーを組み込むことが可能になりました。これにより、Missiveはアプリを離れることなくメッセージを翻訳したりメールのトーンを変更したりすることができます。ユーザーはプロンプトを使用してAIコードを自分の要件に合わせてカスタマイズすることもできます。顧客との連絡の品質を向上させることは、この統合の主な目標であり、AIに特化したデータを供給して適切な返信を提供する能力を向上させることが一部実現されています。 Superflows Superflowsは、1クリックでアクセスできる事前に作成されたコンテキストに関連する応答を提供することで、お客様が受信箱の取り扱いをより迅速に行えるようにするAIで動作するメールアシスタントです。着信メールへの賢明な応答には、カレンダーリンクや他の関連情報が含まれています。これにより、他のソースからデータをコピー&ペーストすることなく、ユーザーは迅速にメールに反応することができます。 Superhuman Superhumanの直感的で高速なインターフェースは、キーボードショートカットや強力な検索機能などの多数の時間節約機能によるものです。Superhumanの革新的なAIで動作する受信箱の組織機能は、忙しいプロフェッショナルにとってゲームチェンジャーです。そのAIエンジンは、ユーザーにとって最も重要なメッセージを学習し、それらを受信箱の前面に優先的に表示します。同社はまた、各ユーザーがSuperhumanとの時間を最大限に活用できるように、個別のコーチングやトレーニングも提供しています。 Scribbly メールにはさまざまな方法で返信することができ、ユーザーには最善の選択肢が与えられます。Scribblyは、メールの文脈に基づいて関連する素材を提案することで、忙しいビジネスパーソンが時間を節約し、効果的なコミュニケーションを行えるよう支援するAI搭載のメールアシスタントです。Scribblyのメール作成機能を使用すると、ユーザーはメールアシスタントに代わってメールを作成するための情報を提供するか、メールにどのように返信するかを象徴する意図を選択することができます。 Tugan Tuganは、企業が情報やプロモーションメッセージを送信するために使用できる人工知能ベースのメールアシスタントです。提供されたURLやトピックに基づいて、Tuganは企業の特定の興味やニーズに合わせてカスタマイズされたメールを生成するためにAIを使用します。受信者は、最も好きなメッセージを選んで送信することができます。時間に制約のあるプロフェッショナル、作家、コンテンツプロデューサーは、このメールヘルパーを最大限に活用できます。Tuganは、市場に比べてまだベータ版の新しいメールヘルパーです。将来の計画には、お気に入りのビジネスグールーのようにメールを生成する機能や、FacebookやYouTubeの広告テキストの製作が含まれます。 AI Mailer AI Mailerは、企業やプロフェッショナルが高品質でカスタマイズされたメールを簡単に送信できるようにするツールです。GPTとNLPテクノロジーを活用して、消費者のメールに対するカスタマイズされたタイムリーな返信を生成し、コンテキストに適したコンテンツを開発します。柔軟なインターフェースと複数言語への組み込み互換性を備えたAI Mailerは、使いやすさを重視して設計されています。学生やビジネスパーソンは、メールのコミュニケーションを向上させるために使用することができ、カスタマーサービスチームは返信のスピードアップやクライアントとの対話のカスタマイズに活用することができます。…
マイクロソフトリサーチとジョージア工科大学の研究者が、言語モデルの幻覚の統計的な境界を公表しました
最近、言語モデルで浮かび上がった主要な問題の一つは、言語モデル(LM)が存在しない記事タイトルへの言及を含む誤った情報を提供する割合が高いことです。メリアム・ウェブスター辞書は、「幻覚」とは「人工知能アルゴリズムによって生成される合理的ながらも虚偽または誤解を招く応答」と定義しています。ある事例では、法的調査を提出した弁護士たちが正確だと思っていた架空の裁判事例を盛り込んでしまい、5000ドルの罰金を科せられました。医療の現場でも、患者の幻覚は命取りとなり、医師たちは過失訴訟を心配しています。さらに、メディアも幻覚について詳細に報道しており、アメリカ合衆国の大統領は最近、生成型人工知能システムからの欺瞞的な結果に対する保護策を含む大統領令を発令しました。 この研究では、マイクロソフトリサーチとジョージア工科大学の研究者が、複数のファクト予測がキャリブレーションされた学習機械(LMs)における幻覚発生率に関する統計的な下限を提示しています。これにより、幻覚の特性が明らかになります。これは幻覚が避けられないことを意味するものではありません。研究チームが議論するとおり、幻覚発生率やキャリブレーションを下げる「事前訓練」手順に「事後訓練」手順を補完するという、実践者の傾向に合致しています。LMは、単語やその他の文字列のシーケンスの確率分布Dであり、正の確率ですべての文字列を予測するLM(典型的なLMの特徴)は、必然的に正の確率で幻覚を示します。ただし、この確率が低い場合、幻覚は珍しいことになります。したがって、幻覚の頻度を測定することは重要です。 完全なシーケンスの対数確率または前のトークンに条件付けられた次のトークンの条件付き対数確率は、同一の分布Dを表現するために使用することができます。log D(t1…tm) = Pm i=1 log D(ti | t1 … ti−1)。この些細な数学的な同等性には重要な意味があります。予測と生成には異なる要件がありますが、自然発生テキストに基づいて前のトークンに条件付けられた次のトークンを予測するために、任意のLMを使用することができます。たとえば、次の文を考えてみましょう。Alexa Wilkinsさんは先週の火曜日にランチのためにSalumeriaに行った理由は、レビューでツナサンドイッチが素晴らしいと言われていたからです。予測型言語モデルは、このような文を提案して、電話のタイピングを軽減するかもしれません。ツナの後に単語としてサンドイッチを予測することは有益かもしれませんし、サラダなどの他の可能性のある単語も含まれるかもしれません。 しかし、生成型のLMがこの種の文の大部分をランダムにでっち上げるとすると、それは誤りです。この記事によると、完全な状況であっても、強力な予測テキスト能力を持つLMは幻覚を経験するはずです。特に、現在では一般的な事前訓練の初期段階では、生成型LMは予測テキストの性能に合わせて調整されます。さらに、その結果は幻覚発生率の下限を提供し、異なる種類の事実がどのような頻度で幻覚化されるべきかについての示唆を与えるでしょう。上記の例と将来参照と(研究チームが5W(Who-Ate-What-When-Where-Why factoids)と呼ぶもの)は、ルールによって系統的に特定できないという点で共通しています。つまり、これらのほとんどの事実は訓練データに含まれていないため、検証することができません。 事実とは異なり、その妥当性が方法論的に確認できるものもあります。多くの理想的な特性を持つ簡略化された状況でも、研究チームはLMが経験する幻覚の数を推定しています。研究チームは、LMの幻覚の根源を特定することを目指すため、統計的な下限が、訓練データがノイズのない状況でi.i.d.になるような単純な文脈で成り立つようにします(ノイズ耐性のある分類技術など)。 研究チームは、生成型モデルへのキャリブレーションの自然な拡張を提供しています。彼らのアイデアは、以前のLMのキャリブレーション応用とは異なり、トークンレベルではありませんでした。各事実はさまざまな方法で自然言語で記述される可能性があるため、トークンの確率をキャリブレーションすることは、生のトークンの確率を評価する際にのみ有用です。むしろ、テキスト内の情報(事実または幻覚)のビットごとの確率分布を、彼らの意味レベルのキャリブレーションによって考慮します。LMがキャリブレーションされているとは、確率a≈zで作成された情報が、与えられた確率z∈[0, 1]で自然発生の言語の一部に平均的に現れることを意味します(理想的には、訓練データが収集された分布と同様)。 この作品は、訓練データが完璧に事実である理想的な世界でも、事実と幻覚のぼやけはなく、各文書には最大で1つの事実しか含まれず、幻覚を促すようなプロンプトさえ存在しない状況でも、予測精度のために事前学習された言語モデルは幻覚を引き起こすことを示すことを目指しています。さらに、彼らの仮説は、トリグラムモデルなど以前の言語モデルと比較可能なデータセットでのトレーニングにも関わらず、現代の言語モデルが以前の言語モデルよりも大きな幻覚を持つのかを明確にします。単一の事実の出現率によって、キャリブレーションされた言語モデルがさまざまな種類の事実について自己欺瞞をする必要がある可能性を示すことができます。 訓練データに頻繁に現れるが一度だけ発生する高い単一事実率を持つ事実が発生すると、幻覚が予測されます。本や記事への言及については、現在研究されている問題の種類の幻覚であることが珍しいことです。したがって、トレーニング中に言語モデルが遭遇する参照などを含む事実の数が、モデルの容量などの他の問題から生じる可能性もあります。また、事後学習を使用せずに事前学習パイプラインを変更することで、幻覚化された参照を修正することが可能かもしれませんが、5Wの例にあるような他の種類の恣意的な事実には対応できません。
新しいLAMPスタック:生成AI開発の革新を照らす
LAMPスタックは、さまざまなドメインでの生成型AIの開発と展開において必須となってきています
詳細に説明されたLlama 2:Metaの大型言語モデル!
MetaのLlama 2についてもっと知りたいですか?ここには基礎から高度な仕様まで、すべてを網羅した初心者向けガイドがあります
「GCPの生成AI機能を活用して変革するBFSIサービス」
「ジェネラティブAI(Gen AI)サービスがクラウドプラットフォーム上で収束することで、BFSIセクターなどの産業革新に前例のない機会が提供されます」
In Japanese 「可視化フレームワークの種類」
あなたのニーズと理想的なビジュアライゼーションフレームワークをマッチさせる
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.