Learn more about Search Results -Crunchbase - Page 13

ロボ犬が100メートル走のギネス世界記録を樹立

ギネスワールドレコーズは、韓国科学技術院のチームが作成した犬のようなロボットを、最速の四足歩行ロボットと認定しました

In Japanese キャプチャを超えて:近代的なボット対策におけるAIの進展の探求

この記事は、従来のCAPTCHAから最先端の身元確認へと進化していくデジタル防御戦略の実践を表しています

2024年に探索するべきトップ12の生成 AI モデル

はじめに 近年、人工知能(AI)は非凡な変革を遂げ、創造性の風景を再構築するだけでなく、多様な産業における自動化の新たな基準を設定する先駆的な技術となっています。2024年に入ると、これらの先進的なモデルは画期的な能力、広範な応用、そして世界に紹介する先駆的なイノベーションにより、その地位を固めました。本記事では、今年の主要な生成型AIモデルについて詳しく探求し、彼らの革新的な能力、様々な応用、そして世界にもたらすパイオニア的なイノベーションについて包括的に説明します。 テキスト生成 GPT-4:言語の神童 開発者:OpenAI 能力:GPT-4(Generative Pre-trained Transformer 4)は、文脈の深い理解、微妙な言語生成、およびマルチモーダルな能力(テキストと画像の入力)で知られる最先端の言語モデルです。 応用:コンテンツの作成、チャットボット、コーディング支援など。 イノベーション:GPT-4は、規模、言語理解、多様性の面でこれまでのモデルを上回り、より正確かつ文脈に即した回答を提供します。 この生成型AIモデルにアクセスするには、こちらをクリックしてください。 Mistral:専門家の混合体 開発者:Mistral AI 能力:Mistralは、専門的なサブモデル(エキスパート)に異なるタスクを割り当てることで効率と効果を向上させる、洗練されたAIモデルです。 応用:高度な自然言語処理、パーソナライズされたコンテンツの推薦、金融、医療、テクノロジーなど、様々なドメインでの複雑な問題解決など、幅広い応用があります。 イノベーション:Mistralは、ネットワーク内の最適なエキスパートにタスクを動的に割り当てることによって特徴付けられます。このアプローチにより、専門的で正確かつ文脈に適した回答が可能となり、多面的なAIの課題処理において新たな基準を設定します。 このMistral AIにアクセスするには、こちらをクリックしてください。 Gemini:多面的なミューズ 開発者:Google AI Deepmind…

このAI論文では、アマゾンの最新の機械学習に関する情報が大規模言語モデルのバグコードについて明らかにされています

プログラミングは複雑であり、エラーのないコードを書くことは時には難しいです。コードの大規模言語モデル(Code-LLMs)はコード補完に役立つために開発されていますが、コードの文脈に潜んでいるバグを見落とすことがあります。この問題に対応するために、ウィスコンシン大学マディソン校とAmazon Web Servicesの研究者が、コード生成中に潜在的なバグを検出するためのLLMsの性能向上についての研究を行いました。 コード-LLMsを活用した自動プログラム修正の研究は、プログラミングのバグの特定と修正の負担を軽減することを目指しています。他のドメインの敵対的な例と同様に、意味を保持したままの小さなコード変換は、コード学習モデルの性能を低下させることがあります。CodeXGLUE、CodeNet、HumanEvalなどの既存のベンチマークは、コード補完とプログラム修復の研究に重要な役割を果たしています。データの利用可能性を高めるために、バグを生成するためのコードミュータントやバグを作成する方法などが開発されています。 統合開発環境における重要な機能であるコード補完は、コードをベースとするTransformerベースの言語モデルの進化とともに進化してきました。しかし、これらのモデルはソフトウェア開発でよく起こるバグの存在を見落とすことが多いです。この研究では、コードの文脈に潜在的なバグが存在するバギーコード補完(bCC)の概念を紹介し、そのようなシナリオでのCode-LLMsの振る舞いを探求しています。バグを含んだデータセットであるバギーHumanEvalとバギーFixEvalを導入し、合成的なバグと現実的なバグの存在下でCode-LLMsの評価を行い、著しい性能低下が明らかになりました。この問題に対処するために、ポストミティゲーション手法が探求されています。 提案されたミティゲーション手法には、バギーフラグメントを削除する「削除して補完」、補完後にバグを修正する「補完して書き直す」、補完前にコード行を書き直してバグを解決する「書き直して補完する」などがあります。合格率によって測定されるパフォーマンスは、補完して書き直すと書き直して補完するが有利です。これらの手法では、RealiTやINCODER-6BのようなCode-LLMsがコードフィクサーとして機能します。 潜在的なバグの存在は、Code-LLMsの生成パフォーマンスを著しく低下させます。1つのバグにつき合格率が50%以上減少します。バグの場所の知識を持つヒューリスティックオラクルは、バギーHumanEvalとバギーFixEvalの間に顕著なパフォーマンスギャップを示し、バグの位置の重要性を強調しています。尤度ベースの手法は、2つのデータセットで異なるパフォーマンスを示し、バグの性質が集約方法の選択に影響を与えることを示しています。バグの存在下でのパフォーマンス改善を提案する削除して補完や書き直して補完などのポストミティゲーション手法もありますが、まだギャップが存在し、潜在的なバグとのコード補完の改善についてのさらなる研究の必要性を示しています。 この研究では、以下の要点でまとめることができます: この研究では、bCCと呼ばれる新しいタスクが紹介されています。 bCCは、潜在的なバグが存在するコードの文脈から機能的な実装を生成します。 この研究は、バギーHumanEvalとバギーFixEvalという2つのデータセットで評価されています。 Code-LLMsのパフォーマンスは著しく低下し、テストケースの合格率が5%以下になります。 削除して補完、書き直して補完などのポストミティゲーション手法が提案されていますが、まだパフォーマンスのギャップが存在します。 この研究は、bCCにおけるCode-LLMsの理解を向上させるものです。 この研究は、潜在的なバグの存在下でコード補完を改善する方法を示唆しています。

カールスルーエ工科大学(KIT)の研究者たちは、深層学習を用いた降水マッピングに取り組み、空間および時間の分解能向上に向けて進化させました

気候変動のため、特に激しい降水イベントがより頻繁に起こると予想されています。洪水や地滑りなどの多くの自然災害は、激しい降水が直接原因です。気候予測に基づいたモデルが頻繁に使用されます。既存の気候モデルは、非常に変動の大きい大気現象を正確に表現する能力を向上させる必要があります。研究者は、平均気温が上昇することにより、激しい降水イベントがさらに増えると予想しています。 カールスルーエ工科大学(KIT)の研究者たちは、人工知能(AI)の力を活用して、グローバル気候モデルによって生成された降水マップの精度を高めました。 研究者は、このモデルでは降水フィールドの時間分解能を1時間から10分に短縮し、空間分解能を32から2キロメートルに増加させたことを強調しています。彼らは、高分解能が将来の激しい局地的な降水イベントとそれに続く自然災害を予測するために必要であると述べています。 この手法は、AIの一形態である生成的対抗ネットワーク(GAN)を応用することを含みます。このGANは、高分解能のレーダー降水データを用いてトレーニングされ、より高い空間および時間分解能で現実的な降水フィールドを学習し模倣することが可能です。 既存のグローバル気候モデルは、降水変動を正確に捉えるために必要な細部の詳細が欠けたグリッドを使用しています。また、高分解能の降水マップを生成するためには、従来のモデルでは計算コストが高く、空間または時間の制約が生じます。 研究者によれば、これが生成的対抗ネットワーク(GAN)を開発する理由であり、高分解能のレーダー降水フィールドを使用してトレーニングされたAIベースの生成的ニューラルネットワークです。この方法では、荒く解像度の低いデータからGANが現実的な降水フィールドを生成し、その時間的な順序を決定する方法を学習します。 三線補間と古典的な畳み込みニューラルネットワークと比較して、生成モデルは解像度依存の極値分布を高い技術力で再構成します。雨量が15ミリリットル毎時を超える場合の高い分数スキルスコア(0.6)と低い相対バイアス(3.35%)が示されました。 研究者によれば、彼らのアプローチはさまざまな可能な降水フィールドのアンサンブルを生成します。これは重要ですが、粗く解像された降水フィールドごとに物理的に可能な高解像度の解決策が多数存在します。 彼らはこの方法でシミュレートされた降水イベントのより高い解像度は、2021年にアール川の洪水を引き起こした気象条件の影響を2度暖かい世界でより良く推定することを可能にすると説明しています。 結論として、このモデルは降水を予測するためのグローバル気候モデルの精度を向上させる解決策を提供します。この進歩はより正確な気候予測に貢献します。変化する気候の中で極端な天候イベントの影響をよりよく理解し、準備するための潜在力を持っています。

「UnbodyとAppsmithを使って、10分でGoogle Meet AIアシスタントアプリを作る方法」

「ほぼコードなしで、Google Meetのビデオ録画を処理し、メモを作成し、アクションアイテムをキャプチャするAIのミーティングアシスタントアプリを開発する方法を学びましょう」

Google Gemini APIを使用してLLMモデルを構築する

導入 ChatGPTとOpenAIのGPTモデルのリリース、およびMicrosoftとのパートナーシップにより、AIの領域にTransformerモデルをもたらしたGoogleはみんなが諦めた存在となりました。 GPTモデルがリリースされてから1年以上が経過しましたが、GoogleからはPaLM API以外に大きな動きはありませんでした。PaLM APIもあまり注目されず失敗に終わりました。そしてGoogleが突如として紹介した基盤となるモデルのグループ、Geminiが登場しました。Geminiの発売からわずか数日後、GoogleはGemini APIをリリースしました。このガイドでは、Gemini APIをテストし、最終的にはそれを使用してシンプルなチャットボットを作成します。 学習目標 GoogleのGeminiシリーズの基礎知識を学ぶ。これには異なるモデル(Ultra、Pro、Nano)と、テキストと画像のサポートを中心とする多様性が含まれます。 Gemini Proのチャット・モデルを使用してチャットベースのアプリケーションを作成するスキルを開発し、チャットの履歴を維持し、ユーザーの文脈に基づいて応答を生成する方法を理解する。 Geminiが安全であるために、不安全なクエリを処理し、さまざまなカテゴリの安全性評価を提供することにより、責任あるAIの使用を保証する方法を探索する。 Gemini ProとGemini Pro Visionモデルを使用した実践的な経験を積み、画像の解釈と説明を含む、テキスト生成とビジョンに基づく機能を探索する。 Gemini APIとLangchainを統合して、相互作用のプロセスを簡素化する方法を学び、複数のクエリを効率的に処理するための入力と応答のバッチ処理について学ぶ。 この記事はデータサイエンスブログサラソンの一部として公開されました。 Geminiとは何ですか? Geminiは、Googleが構築し導入した新しい基盤モデルのシリーズです。これはこれまでのPaLMと比べて最も大きなモデルセットであり、最初から多様性に焦点を当てて構築されています。これにより、Geminiモデルはテキスト、画像、オーディオ、ビデオなどの異なる情報タイプの組み合わせに強力です。現在、APIは画像とテキストのサポートを提供しています。Geminiは、ベンチマークで最先端のパフォーマンスを達成し、多くのテストでChatGPTとGPT4-Visionモデルを上回っています。 Geminiには、サイズに基づいて3つの異なるモデルがあります。サイズの順に、Gemini Ultra、Gemini Pro、Gemini…

データの汚染を防ぐためのサイバーセキュリティ対策

新しく発展している人工知能(AI)や機械学習(ML)のような技術は、世界中の産業や日常生活の改善に不可欠ですしかし、悪意のある者たちは常にこれらの新興技術をより邪悪なものに変える方法を探し求めており、データの悪用は深刻な問題となっていますそれに備える必要があります何が...

ルーシッドドリーマー:インターバルスコアマッチングを介した高品位のテキストから3D生成

最近のテキストから3DジェネレーティブAIフレームワークの進歩は、生成モデルにおける重要な節目を示していますこれらは、数多くの現実世界のシナリオで3Dアセットを作成する新たな可能性を開拓していますデジタル3Dアセットは現在、私たちのデジタル存在において不可欠な場所を占めており、複雑な環境やオブジェクトとの包括的な視覚化や対話を可能にしています

「あなたのMLアプリケーションを際立たせるための6つの効果的なヒント」

あなたの機械学習アプリケーションで目立つ方法を考えることは、何に取り組むべきかさえわからないと恐ろしいかもしれませんそこで、このブログ投稿では、実践的な6つのヒントを共有します...

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us