Learn more about Search Results A - Page 10
- You may be interested
- Learning to build—Towards AI コミュニテ...
- 「科学者たちが他の種とコミュニケーショ...
- ハッカーは、主要なセキュリティテストでA...
- 「Python タイムスタンプ:初心者のための...
- スマートインフラストラクチャのリスク評...
- 「データウェアハウジング入門ガイド」
- ボロノイ格子:実用的な応用
- 「ODSC West 2023 の最初の50セッションが...
- データサイエンスのキャリアをワンランク...
- 「メーカーに会う:開発者がAI搭載ピット...
- このAIの論文は、インコンテキスト学習の...
- DeepMindの最新のICLR 2022での研究
- Contextual AIは、VQAv2においてFlamingo...
- スタンフォード大学研究者が提案するMAPTr...
- PySparkでの最高のデータ整形機能
「23andMeにおける複数の個人情報漏洩」
「盗まれた遺伝子データがテスト会社に対する集団訴訟につながる」
「Forza Horizon」がGeForce NOWにレースを展開」
このGFN Thursdayは、Microsoft Studiosの最新のForza Horizonゲームでタイヤを焼き尽くします。PC Game Passでチェックしてみてください。 さらに、最新のメンバーシップバンドルでクラウドゲーミングのギフトを贈りましょう。このバンドルには、6ヶ月のGeForce NOW Ultimateメンバーシップの購入で無料の3ヶ月のPC Game Passサブスクリプションが含まれています。 これは13の新しいゲームがGeForce NOWのライブラリに参加するエキサイティングな週の一部です。 ズームズーム プレイグラウンドゲームズとMicrosoft StudiosのForza Horizon 4およびForza Horizon 5にドライバーシートに飛び乗ってください。評価の高いオープンワールドレーシングゲームで、ダイナミックな天候と季節が最も経験豊富なドライバーですら大成功または大失敗にすることができます。 フォルツァクラウド。 美しい歴史あるイギリスを舞台にForza Horizon 4でレースを繰り広げましょう。単独で乗り出すか、オンラインで世界中のプレイヤーと共有のオープンワールドでチームを組めます。Horizonカーロスターの450台以上の車を収集、改造、運転し、レースやスタント、創造、探索をしてHorizonのスーパースターになりましょう。…
忙しい生活を管理するためにAIツールを利用する6つの賢い方法
技術の進化によって世界がほぼ完全に駆動される時代において、ついていくのに苦労しているように感じることは簡単ですしかし、AIツールにはその負担の一部を肩代わりしてくれる可能性がありますスケジュールの管理やメールのフィルタリングを手助けしてくれる賢いテクノロジーによって混沌を切り抜けることを想像してみてください忙しい生活を管理するためにAIツールを利用する6つの賢い方法」
AIによる安全な自転車ヘルメット、そしてより優れた靴のソール
スイスのETH Zurichの研究者たちが開発した人工知能(AI)ツールは、3Dプリントが可能な新しいメタマテリアルを予測することができます
オープンAIのイリヤ・サツキバーは、超知能AIを抑制するための計画を持っています
スーパーアライメントチームは、OpenAIのチーフサイエンティストであるイリヤ・サツケヴェルに率いられ、AIモデルの振る舞いをよりスマートにガイドする方法を考案しました
ChatGPTが知能的ですか? 科学的なレビュー
約1年前、OpenAIはChatGPTをリリースし、世界中を席巻しましたChatGPTは、コンピュータとの対話を、従来のより制約の少ない、より自然な言語で行うという完全に新しいアプローチを取り入れました
音楽業界におけるAI:ミュージックメタバースと未来の音楽の形成にどのような影響を及ぼすのか?
AIはすでに音楽業界を革命しましたAI生成ツールによって、クリエイターはロイヤリティフリーの音楽を生成することができますまた、生成型AIストリーミング製品では、ユーザーが楽しむための絶え間ないムードに基づいたプレイリストが提供されますAIによって生成された曲は、「似たような音」や人気アーティストの有名な曲を別のAIの声で歌っていることが話題になっています
SalesForce AI 研究 BannerGen マルチモダリティ バナー生成のためのオープンソース ライブラリ
効果的なグラフィックデザインは成功したマーケティングキャンペーンの基盤です。それはデザイナーと視聴者の間のコミュニケーション橋渡しを行い、ユーザーを魅了し、重要な詳細を強調し、キャンペーンの視覚的な外観を向上させます。しかし、現在の方法は時間のかかるものであり、層ごとの組み立て作業が必要です。これには専門知識が必要であり、スケーラブルにはなりません。 上記の問題を解決するために、Salesforceの研究者は、生成型AIの力を活用してデザインプロセスを効率化するオープンソースのライブラリBannerGenを導入しました。このライブラリには、3つの並列マルチモーダルバナージェネレーションメソッド、LayoutDETR、LayoutInstructPix2Pix、およびFramed Template RetrieveAdapterが含まれます。それぞれが大量のデザイングラフィックデータでトレーニングを受けており、デザインプロセスを迅速化できます。さらに、これらすべてがBannerGenのGitHubリポジトリでオープンソース化されており、Pythonモジュールとしてインポートできるため、開発者は各メソッドで実験することが容易です。BannerGenには、ライセンスされたフォントと注意深く作成されたテンプレートもあり、開発者は高品質のデザインを構築することができます。 ユーザーはバナーを作成したい画像をアップロードすることができます。その画像は、主要な要素に焦点を当てて複数のサブイメージにクロッピングされます。ユーザーはまた、希望するバナーのタイプと含めたいテキストを指定することもできます。サブイメージは選択したテンプレートに統合され、見事なビジュアルが作成されます。最終的なデザインはHTMLファイルとPNGファイルとして生成されます。 研究者はVAEGANフレームワークを取り入れて、生成されたデザインを現実のパターンに合わせるようにしました。DETRアーキテクチャもBannerGenに組み込まれ、LayoutDETRとして言及されています。研究者はDETRデコーダを変更して、マルチモーダルの前景入力を処理できるようにしました。このアーキテクチャにより、BannerGenは背景と前景要素をより良く理解することができ、より良い結果を生み出します。 BannerGenは、拡散モデルによって強化された画像から画像への編集技術であるInstructPix2Pixも組み込んでいます。それは背景画像をテキストが重ねられた画像に変換するように微調整されています。 3番目のメソッドであるFramed Template RetrieveAdapterは、生成されたデザインの多様性を向上させるために使用され、3つのコンポーネントで構成されています。メトリクスに基づいて最適なフレームを見つけるリトリーバー、フレームに適合するように入力画像とテキストをカスタマイズするアダプター、背景レイヤーとユーザーの入力を統合してHTML/CSSでデザインを生成するレンダラーです。 まとめると、BannerGenは生成型AIを活用してユーザーがシームレスにカスタマイズされたバナーを作成できる強力で多機能なフレームワークです。BannerGenのアーキテクチャは実際のレイアウトから学ぶように設計されており、背景と前景要素を理解することができます。最終的なデザインはHTMLファイルとPNGファイルとして生成され、手動で簡単に調整することができ、すぐに使用できるように任意のメディアに埋め込むことができます。BannerGenはグラフィックデザインのプロセスを時間のかかるものから解放し、ユーザーが高品質でプロフェッショナルなデザインを生成するのを支援します。 この記事はSalesForce AI Research BannerGen: An Open-Source Library for Multi-Modality Banner GenerationがMarkTechPostに最初に掲載されました。
このAI論文は、TreeOfLife-10Mデータセットを活用して生物学と保護のコンピュータビジョンを変革するBioCLIPを紹介しています
生態学、進化生物学、生物多様性など、多くの生物学の分野が、研究ツールとしてデジタルイメージおよびコンピュータビジョンを活用しています。現代の技術は、博物館、カメラトラップ、市民科学プラットフォームから大量の画像を分析する能力を大幅に向上させました。このデータは、種の定義、適応機構の理解、個体群の構造と豊富さの推定、生物多様性の監視と保全に活用することができます。 とはいえ、生物学的な問いにコンピュータビジョンを利用しようとする際には、特定のタスクに適したモデルを見つけて訓練し、十分なデータを手動でラベリングすることは、依然として大きな課題です。これには、機械学習の知識と時間が大量に必要とされます。 オハイオ州立大学、マイクロソフト、カリフォルニア大学アーヴァイン校、レンセラーポリテクニック研究所の研究者たちは、この取り組みで生命の木の基礎的なビジョンを構築することを調査しています。このモデルは、実際の生物学的なタスクに一般的に適用できるように、以下の要件を満たす必要があります。まず、一つのクラドだけでなく、様々なクラドを調査する研究者に適用できる必要があります。そして理想的には、生命の木全体に一般化できることが求められます。さらに、生物学の分野では、同じ属内の関連種や、適応度の向上のために他の種の外観を模倣するなど、視覚的に類似した生物と遭遇することが一般的です。生命の木は生物を広義のグループ(動物、菌類、植物など)および非常に細かいグループに分類しているため、このような細かな分類の精度が重要です。最後に、生物学におけるデータ収集とラベリングの高いコストを考慮して、低データの状況(例:ゼロショットまたはフューショット)で優れた結果が得られることが重要です。 数億枚の画像で訓練された現行の汎用ビジョンモデルは、進化生物学や生態学に適用する際に十分な性能を発揮しません。しかし、これらの目標はコンピュータビジョンにとって新しいものではありません。研究者たちは、生物学のビジョン基盤モデルの作成には2つの主な障害があることを特定しています。まず、既に利用可能なデータセットは、サイズ、多様性、またはラベルの精度の点で不十分ですので、より良い事前トレーニングデータセットが必要です。さらに、現在の事前トレーニングアルゴリズムは3つの主要な目標に適切に対応していないため、生物学の独特な特性を活用したよりよい事前トレーニング方法を見つける必要があります。 これらの目標とそれらを実現するための障害を念頭に置いて、チームは以下を提示しています: TREEOFLIFE-10Mという大規模なML対応の生物学画像データセット BIOCLIPはTREEOFLIFE-10M内の適切な分類群を用いてトレーニングされた生命の木を基盤としたビジョンベースのモデルです。 TREEOFLIFE-10Mは、ML対応の広範な生物学画像データセットです。生命の木において454,000の分類群をカバーする10,000,000以上の写真が含まれており、研究者たちによって編成され、最大のML対応生物学画像データセットが公開されました。2.7百万枚の写真は、最大のML対応生物学画像コレクションであるiNat21を構成しています。iNat21やBIOSCAN-1Mなどの既存の高品質データセットもTREEOFLIFE-10Mに組み込まれています。TREEOFLIFE-10Mのデータの多様性の大部分は、新たに選択された写真が含まれているEncyclopedia of Life(eol.org)から得られています。TREEOFLIFE-10Mのすべての画像の分類階層および上位の分類順位は、可能な限り注釈が付けられています。TREEOFLIFE-10Mを活用することで、BIOCLIPや将来の生物学モデルをトレーニングすることができます。 BIOCLIPは、視覚に基づく生命の木の表現です。TREEOFLIFE10Mのような大規模なラベル付きデータセットを用いてビジョンモデルをトレーニングする一般的で簡単なアプローチは、監視付き分類ターゲットを使用して画像から分類指数を予測することを学ぶことです。ResNet50やSwin Transformerもこの戦略を使用しています。しかし、このアプローチは、分類群が体系的に関連している複雑なタクソノミーのシステムを無視し、活用していません。したがって、基本的な監視付き分類を使用してトレーニングされたモデルは、未知の分類群をゼロショット分類することができない可能性があり、トレーニング時に存在しなかった分類群に対してもうまく一般化することができないかもしれません。その代わりに、チームは、BIOCLIPの包括的な生物学的タクソノミーとCLIPスタイルの多モーダルコントラスティブ学習を組み合わせる新しいアプローチに従っています。CLIPコントラスティブ学習目的を使用することで、彼らは分類群の階層をキングダムから最も遠い分類群ランクまでフラット化して、分類名として知られる文字列に関連付けることができます。BIOCLIPは、可視化できない分類群の分類名を使用する際にも、ゼロショット分類を行うことができます。 チームは、混合テキスト型のトレーニング技術が有益であることを提案し、示しています。これは、分類名からの一般化を保ちつつ、複数のテキストタイプ(例:科学名と一般名)を組み合わせたトレーニング中に柔軟性を持つことを意味します。たとえば、ダウンストリームの使用者は一般的な種名を使用し続けることができ、BIOCLIPは非常に優れたパフォーマンスを発揮します。BIOCLIPの徹底的な評価は、植物、動物、昆虫を対象とした10の細かい画像分類データセットと、トレーニング中には使用されなかった特別に編集されたRARE SPECIESデータセットに基づいて行われています。BIOCLIPは、CLIPとOpenCLIPを大きく凌ぎ、few-shot環境では平均絶対改善率17%、zero-shot環境では18%の成績を収めました。さらに、その内在的な分析はBIOCLIPのより優れた一般化能力を説明することができます。これは、生物分類学的階層を遵守した階層的表現を学んでいることを示しています。 BIOCLIPのトレーニングは、数十万の分類群に対して視覚表現を学ぶためにCLIPの目的を利用しているということにもかかわらず、チームは分類に焦点を当てたままです。今後の研究では、BIOCLIPが細かい特徴レベルの表現を抽出できるよう、inaturalist.orgから100百万枚以上の研究用写真を取り込み、種の外見のより詳細なテキスト記述を収集する予定です。
GoogleのAIスタジオ:ジェミニの創造的な宇宙への入り口!
Googleは、AI Studioの発売を通じて、開発者向けの画期的な革新を実現しました。このWebベースのプラットフォームは、Gemini AIモデルへのシームレスなアクセスを提供することを目指しています。この革新により、Gemini Proの先進的な自然言語生成能力を活用して、チャットボット、アプリケーション、さまざまなソフトウェアの開発と展開が革新されることになります。 AIスタジオのお披露目- Geminiエコシステムへの入り口 AI Studio(以前はMakerSuiteとして知られる)は、Googleの広範なGeminiエコシステムへの重要な入り口として立ち上がっています。開発者は、Gemini Proと今後のGemini Ultraモデルの力を利用するチャンスがあります。無料の使用クォータ、コードライブラリ、必要なツールを提供するAIスタジオは、クリエイティブな創造とアプリケーションの公開に適した環境を提供します。 改良と価格設定の構造 この改良されたプラットフォームは、以前のものと比べて重要な改善が加えられており、セーフティ、プロンプト、出力スタイルの調整コントロールを備えています。価格設定は、OpenAIのGPT-3.5 Turbo LLMと競合するよう戦略的に位置付けられており、透明性とアクセシビリティが確保されています。開発者は、Gemini Proモデルの入力1,000文字あたり0.00025ドル、出力1,000文字あたり0.0005ドルの公正な価格設定を期待することができます。 開発者の体験 Google AI Studioは、使いやすいインターフェースで開発プロセスを簡素化します。開発者は、モデルを選択し、クリエイティブなパラメータを微調整し、トーンやスタイルの指示をシームレスに統合することができます。一分間あたり60リクエストの無料クォータが提供されるため、開発者は制約なくアイデアを繰り返すことができます。AI Studioからコードへの移行も容易に行えるため、さまざまな開発環境でスムーズなワークフローが実現できます。 Vertex AIとの統合と将来のロードマップ AI Studioの注目すべき特長の一つは、GoogleのVertex…
Find the right Blockchain Investment for you
Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.