Learn more about Search Results A - Page 292

「学術目的でAIを使用する際の倫理的考慮事項」 翻訳結果は以下の通りです: 「学術目的でAIを使用する際の倫理的考慮事項」

「AIを活用したサービスは、さまざまな業界で革命を起こしており、学界も例外ではありませんしかし、画期的な技術には倫理的な考慮事項がつきものですなぜこの議論が重要なのでしょうか?それは、教育へのアプローチが将来の世代を形作るからですAIを活用したエッセイサービスとは何でしょうか?その核心は、人工知能を活用してエッセイの作成、改善、または...」

「目と耳を持つChatGPT:BuboGPTは、マルチモーダルLLMsにおいて視覚的なグラウンディングを可能にするAIアプローチです」

大規模言語モデル(LLM)は、自然言語処理の領域でゲームチェンジャーとして登場しました。彼らは私たちの日常生活の重要な一部になりつつあります。最も有名なLLMの例はChatGPTであり、この時点でほとんどの人がそれについて知っており、ほとんどの人が日常的に使用していると安全に言えます。 LLMはその巨大なサイズと膨大なテキストデータからの学習能力によって特徴付けられます。これにより、彼らは一貫した文脈に即した人間らしいテキストを生成することができます。これらのモデルは、GPT(Generative Pre-trained Transformer)やBERT(Bidirectional Encoder Representations from Transformers)などの深層学習アーキテクチャに基づいて構築されており、言語の長距離依存関係を捉えるために注意メカニズムを使用しています。 大規模なデータセットでの事前トレーニングと特定のタスクでの微調整を活用することで、LLMはテキスト生成、感情分析、機械翻訳、質問応答など、さまざまな言語関連のタスクで優れたパフォーマンスを発揮しています。LLMが改良を続けるにつれて、機械と人間のような言語処理の間のギャップを埋め、自然言語の理解と生成を革新するという莫大なポテンシャルを秘めています。 一方、一部の人々は、LLMがテキスト入力に限定されているため、その全ての潜在能力を活用していないと考えていました。彼らはLLMの潜在能力を言語以外の領域に広げる取り組みを行ってきました。いくつかの研究では、画像、動画、音声、オーディオなどのさまざまな入力信号をLLMと統合し、強力なマルチモーダルチャットボットを構築することに成功しています。 しかし、ここにはまだ長い道のりがあります。これらのモデルのほとんどは、視覚オブジェクトと他のモダリティの関係を理解していません。視覚的に強化されたLLMは高品質な説明を生成することができますが、視覚的な文脈に明示的に関連付けることなく、ブラックボックス的な方法で行います。 マルチモーダルLLMにおいてテキストと他のモダリティの間に明示的かつ有益な対応関係を確立することで、ユーザーエクスペリエンスを向上させ、これらのモデルに新たな応用を可能にすることができます。そこで、私たちはBuboGPTに会いましょう。これはこの制約に取り組むものです。 BuboGPTは、視覚オブジェクトを他のモダリティに接続することでLLMに視覚的な基礎付けを取り入れる最初の試みです。BuboGPTは、事前トレーニングされたLLMとよく一致する共有表現空間を学習することにより、テキスト、ビジョン、オーディオのための共同マルチモーダル理解とチャットを実現します。 BuboGPTの概要。出典: https://arxiv.org/pdf/2307.08581.pdf 視覚的な基礎付けは容易な課題ではないため、それがBuboGPTのパイプラインの重要な部分を担っています。このメカニズムは、視覚オブジェクトとモダリティとの間の細かい関係を確立します。 パイプラインには、タギングモジュール、グラウンディングモジュール、エンティティマッチングモジュールの3つのモジュールが含まれています。タギングモジュールは、入力画像の関連するテキストタグ/ラベルを生成し、グラウンディングモジュールは各タグに対して意味的なマスクまたはボックスをローカライズし、エンティティマッチングモジュールはタグと画像の説明から一致するエンティティをLLMの推論に使用します。視覚オブジェクトと他のモダリティを言語を介して接続することで、BuboGPTはマルチモーダル入力の理解を向上させます。 BuboGPTチャットの例。出典: https://arxiv.org/pdf/2307.08581.pdf 任意の入力の複数モーダル理解を可能にするために、BuboGPTはMini-GPT4に似た2段階のトレーニングスキームを採用しています。最初の段階では、音声エンコーダとしてImageBind、視覚エンコーダとしてBLIP-2、および言語とビジョンまたは音声の特徴を整列させるQ-formerを学習するためのLLMとしてVicunaを使用します。2番目の段階では、高品質な指示に従うデータセットでマルチモーダルな指示の調整を行います。 このデータセットの構築は、LLMが提供されたモダリティを認識し、入力が適切にマッチしているかどうかを認識するために重要です。したがって、BuboGPTは、ビジョン指示、音声指示、正の画像・音声ペアを使用した音の位置づけ、および意味推論のための負のペアを使用した画像・音声キャプショニングのためのサブセットを持つ、新しい高品質なデータセットを構築しています。負の画像・音声ペアを導入することで、BuboGPTはより良いマルチモーダルな整合性を学び、より強力な共同理解能力を示すことができます。

DEF CONでハッカーたちがいたずらをしてAIの脆弱性を暴露

ラスベガスで開催されるDEF CONハッキングカンファレンスでは、知恵とテクノロジーの魅力的な衝突が行われます。ハッカーたちは、Google、Meta Platforms、OpenAIなどの業界の巨人が開発した大規模な言語モデル(LLM)の欠陥やバイアスを明らかにするため、悪戯なトリックを駆使してAIアルゴリズムをテストします。このホワイトハウスの支援を受けた前例のないコンテストは、AI開発者が生成型AIシステムに悩まされる複雑な課題に対処できるガードレールの構築に一歩近づくことを目指しています。 また読む:OpenAIのAI検出ツールはAI生成コンテンツの74%を検出できません 「悪い数学」の解明:AIの脆弱性を解き明かす ジョージア州サバンナ出身の学生、ケネディ・メイズは、AIアルゴリズムに挑戦するミッションに乗り出しました。彼女は魅力的な対話の末に、アルゴリズムを「9 10 = 21」と宣言させることに成功しました。軽いいたずらに見えるこの行為には、AIシステム内に潜む制限やバイアスを明らかにするというより深い目的があります。 また読む:数学の方程式が線形回帰モデルの構築にどのように使われるか タイタンの戦い:人間対AI DEF CONのハッカーたちは、156台のラップトップを手に、世界でも最も先進的なAIモデルに勝つためのクエストに乗り出しました。これらの8つのモデルは、ハッカーがさまざまな問題を解明しようとする中で、些細な問題から潜在的に危険な問題までを抱えています。ハッカーたちは、これらのモデルに人間らしさを主張させたり、誤った情報を広めたり、虐待を推奨したりすることを試みています。 また読む:人工知能対人間の知能:トップ7の違い ガードレールの探求:AIビーストの制御 大規模な言語モデルは、産業やプロセスを再構築する可能性を持っています。しかし、それらはまた、世界的な規模で不正確さや不正義を引き起こすことができる固有のバイアスや欠陥を抱えています。ホワイトハウスの支持を受けたDEF CONのコンテストは、LLMに関連する問題を抑制するためのセーフガードの確立を企業に促すことを目指しています。 バイアスの解明:トリッキーな数学以上の懸念 ケネディ・メイズにとって、課題は「悪い数学」よりも深いレベルで続きます。AIモデルに内在するバイアスは、特に人種差別などの問題の文脈で、重大な懸念を引き起こします。メイズの実験は、AIモデルが偶然にも憎悪に満ちた差別的な発言を支持する可能性があり、偏見の拡散の懸念が生じることを示しました。 また読む:FraudGPT:AIパワードサイバー犯罪ツールの驚異的な台頭 「責任あるAI」の追求 バイデン政権のディープリー・ナショナル・サイバー・ディレクターであるカミール・スチュワート・グロスターは、AIの乱用や操作を防ぐことの重要性を強調しています。ホワイトハウスの取り組みは、AIのためのブループリントやAIに関する行政命令などのイニシアチブを含んでいます。目標は、安全で透明性のある安全なAIシステムの開発を促進することです。 また読む:AI信頼カーブに先んじて:オープンソースの責任あるAIツールキットが公開されました 脆弱性の暴露:協力の呼びかけ…

「AmazonがAIによるレビューの要約を導入」

1995年、Amazonは顧客レビューのコンセプトを導入することで、電子商取引の風景を一変させました。これは、ショッパーが製品について自由に意見を述べることができるプラットフォームでした。懐疑的な意見もありましたが、顧客が本当のフィードバックを共有する機会を受け入れるという斬新なアイデアは人気を博しました。時間の経過とともに、Amazonの顧客レビューシステムは、潜在的な購入者にとって貴重な洞察を提供する、オンラインショッピングの礎となりました。 革新はAmazonのレビューシステムの旅の特徴です。最初はレビュータイトルなどの基本的な機能から始まり、後に写真や動画などのマルチメディア要素に拡大しました。2019年には、Amazonは顧客が素早く星の評価を残すことができるようになり、レビュープロセスが効率化されました。Amazonの製品範囲が拡大するにつれ、レビュアーを多様化し、地理的な枠組みを超える努力がなされ、異なる地域のレビューがグローバルな顧客にアクセス可能になりました。 生成的AIの出現は、向上の新たな道を提示しました。AmazonはAIの力を活用して、顧客のレビュー全体にわたる主要なテーマと感情を捉えた簡潔なレビューハイライトを作成しました。これらのAIによる要約は、製品の属性や顧客の意見を一目で理解するためのものです。現在、米国の一部のモバイルショッパーに利用可能なこの機能は、ユーザーのフィードバックと好みに基づいて拡大する予定です。 この進化の基盤となっているのは、Amazonの信頼性の高いレビューエコシステムの維持です。Amazonは高度な機械学習モデルとエキスパート調査員に頼り、偽のレビューを特定し予防するための取り組みを行っています。この多面的なアプローチは、ユーザーの行動パターンや過去のレビューアクティビティなど、さまざまなデータポイントを分析します。AIによるレビューハイライトは、検証済みの購入だけから引用され、その信頼性が高まります。 Amazonは単なる便利さを超えて、顧客に本物の洞察を与えることを目指しています。透明性と信頼性への取り組みにより、ユーザー主導で技術的に革新的なレビューシステムの道が開かれました。Amazonはレビューの提出プロセスをさらに洗練し、AIの進歩を活用することで、仲間の消費者の知恵によって強化された、ますますシームレスで信頼性のあるショッピング体験を顧客に提供し続けることができます。

「ArgoCDを使用して、マルチ環境でのイメージプロモーションの課題を解決する」

「マルチ環境展開におけるイメージのプロモーション課題を解決するArgoCDの仕組みを知ろうGitOps、ArgoCD、Kustomizeが、追跡とプロモーションを簡素化し、イメージレジストリの肥大化という見過ごされていた課題に取り組みます革新的な解決策をご覧ください!」

「コンシューマハードウェア上でPythonコーディングのためにLlama2を微調整する方法」

「教師あり微調整と低ランク適応技術によるPythonにおけるLlama2の能力向上」

15 AIによる音声編集ツール

音響エンジニアや音楽プロデューサーは、メロディやハーモニーの生成、音質の向上など、創造プロセスのさまざまな領域を強化するために、AIオーディオツールと呼ばれるインテリジェントなソフトウェアプログラムを使用しています。これらの技術は、大規模なデータセットを分析し、複雑なパターンを検出する能力を持つため、ワークフローを最適化しようとする音楽プロデューサーやサウンドデザイナーの間で人気を集めています。 LANDR LANDRには2000万件のマスタリングされた録音と使いやすいインターフェースがあります。LANDRは、Lady Gaga、Gwen Stefani、Snoop Dogg、Seal、Post Maloneなどのトップスタジオエンジニアによってマスタリングされた曲を持つAIマスタリングテクノロジーです。このツールの直感的なドラッグアンドドロップインターフェースは、オーディオプロフェッショナルやミュージシャンにとってオーディオマスタリングをより簡単にします。LANDRのマスタリングチェーンは、創造的な出力を最大化するために慎重に構築されています。そして、他のどのサービスとも異なり、LANDRは各対応プラットフォーム用にカスタムビルドのマスタリングプラグインを提供しています。 Studio Sound Descriptは、人工知能を利用してコンテンツ作成プロセスを高速化するクラウドベースのビデオ作成プラットフォームであり、その中にはStudio Soundというツールもあります。Studio Soundは、バックグラウンドノイズやエコーを排除して話者の声に集中するためのものです。再生生成アルゴリズムを使用して、この技術は音声の明瞭さを向上させ、バックグラウンドノイズを除去します。ポッドキャスターやYouTuber、他のコンテンツクリエーターがオーディオ編集に時間を節約したい場合には、素晴らしいツールです。このツールは、オーディオ、ビデオ、スクリーン録音からバックグラウンドノイズや部屋のエコーなどの邪魔な音を除去し、ユーザーの声を向上させます。 Splitter 音響エンジニアは、楽曲から楽器を分離するために機械学習プログラムであるSplitterを使用することができます。このソフトウェアは、オーディオプロフェッショナルの効率を向上させるために4つの異なるモデルを提供します。5ステムモデルは、ボーカル、ドラム、ピアノ、ベース、ギターやシンセサイザーを含む他の楽器/エフェクトを正確に分離することができるため、このコンセプトを優れた形で示しています。2ステムモデルは、ボーカルと楽器のステムを分離することで同じことを行います。ミュージシャン、DJ、アーティスト、法科学者、音響エンジニア、カラオケファン、警察、科学者など、同社はさまざまなグループに製品を提供することを目指しています。Splitterの創設者は、科学技術と音楽業界の幅広い経験を持つ著名な音楽プロデューサー兼音響エンジニアです。 Sonible’s smart: EQ3 EQ3は、AIフィルターを使用して音のバランスを機械的に修正するインテリジェントなイコライザです。ハードな共鳴やノッチを除去することで、バランスの取れたサウンドを実現します。インテリジェントなクロスチャネル処理を利用することで、ユーザーは最大6つのチャンネルを簡単に整理し、各トラックが適切に使用されるようにします。アルゴリズムは、グループ化されたチャンネルからのスペクトルデータを分析して、ミックス内の各トラックにどれだけのスペースを与えるかを決定します。ユーザーは芸術的な目標に応じて音の階層を設定することができます。 Orb Producer Suite 3 Orb Producer…

「Java ZGCアルゴリズムのチューニング」

ZGCは、Javaアプリケーションにおいて大きなヒープを管理し、一時停止を最小限に抑えることに特化したガベージコレクターです詳細はこちらをご覧ください!

「AIは個人の知識管理をどのように変革しているのか?」

AIスタートアップは、ビジネスが知識ベースを整理しアクセスする方法を変革しようと努力していますが、個人が使用しているツールはB2Bツールと比較して遅れていると言えます。 「あなたのパーソナルナレッジ管理ツールは何ですか?」というのは、一般の人々がよく聞く質問ではありません。 代わりに、次のような質問に答えます: 「ノートを整理するためにどのアプリを使用していますか?」 「最初のカメラについての主なおすすめは何ですか?」 「個人のプロジェクトを追跡する方法は?」 これらの質問はユースケースに基づいており、その答えはあまり変わりません。通常、同じようなものを見つけます(ノート:Google Keep、Apple Notes、Evernote;写真:Google Photos、Instagram;おすすめ:メールの受信箱またはWhatsapp)。 しかし、一つのアプリやソフトウェアですべてを管理するものはありません。 そしてAIの出現により、パーソナルナレッジ管理の世界に改善の余地があるかもしれません。 パーソナルナレッジ管理とは何ですか? パーソナルナレッジ管理(PKM)は、個人が自分自身の知識をキャプチャし、整理し、処理し、共有するアプローチです。私たちは経験、情報、関連付けによって何かを知ることを知識と定義しています。PKMは、個人とプロフェッショナルの文脈でこの膨大な情報を効果的に管理し利用するために使用されるすべての戦略とツールを包括します。PKMの目標は、洞察、ノート、反省、リソースの構造化された相互接続されたリポジトリを作成することによって、個人の学習、問題解決、意思決定を向上させることです。PKMについて話すとき、通常、ジャーナリング、ノート取り、情報のタグ付け、継続的な自己指導型学習を指します。 AIはどのようにしてパーソナルナレッジ管理を支援できますか? 検索以上の機能… ノート、投稿、記事、メッセージを集めるプロセスでは、機械学習アルゴリズムが知識をナビゲートするのに役立ちます。すでにいくつかのスタートアップがこのセグメントを研究しています。それらの一部は、物理的およびデジタルのシステム(ノートパソコンやスマートフォン)に保存されたすべての情報を記録して、情報の検索を容易にすることを提供しています。プロフェッショナル向けに開発されたこれらのアプリは、会議の要約、メール、またはOneNoteの下書きを整理し、タスクを達成するのに非常に役立っています。Slackのメッセージ、ノート、または自分自身の入力で充実させたドキュメントを共有することができます。 ただ一つの欠点があります:聴衆とのインタラクションの欠如です。そして、ここでAIが登場します。AIは、検索体験の複雑さを超えるより効果的な方法を提供することを約束しています。AIは以下のようなものをもたらしました: 利用可能性:AIは、ターゲットとなるコンテンツを常に利用できるようにすることができます。パーソナルナレッジベースでも同じことができるとしたらどうでしょうか?人々がそれを共有するのを待つ代わりに、経験、スキル、ストーリーは常に検索可能になるでしょう。 接続:データベースをクエリすることは、ウェブ製品の世界では一般的なアクションになりました。AIがパーソナルナレッジベースのクエリを可能にし、ユーザーフレンドリーな方法で即座に回答を得ることができたらどうでしょうか? 個別化:人工汎用知能は急速に発展しています。パーソナルナレッジベースがスマートで有用になる技術を持つようになった今、個人自身の手に個別化をもたらす時が来ました。 AIは数年前には夢にも思えなかった能力をもたらしました。なぜこの新しい領域に入らないのでしょうか? パーソナルAIがパーソナルナレッジ管理を革新する パーソナルAIは、自分自身のAIを作成、訓練、成長させるためのツールを提供するAIのカテゴリです。ただし、1兆のデータポイントに依存するのではなく、パーソナルAIはあなたのデータから学習します:あなたのスキル、経験、思い出。パーソナルAIは、あなたのメモリバンクから引用し、新しい執筆プロジェクトに命を与え、プロフェッショナルなバックグラウンドから新しいビジネスのアイデアを探求し、創造性を引き出す人々とのシームレスなつながりを提供する、あなたのオンライン上の真の拡張です。…

「分かれれば倒れ、一緒に立つ:CoTrackerは、ビデオ内の複数のポイントを共同で追跡するAIアプローチです」

I had trouble accessing your link so I’m going to try to continue without it. 近年、AIの領域で画像生成と大規模言語モデルの進歩が目覚ましく、その革新的な能力により長い間注目を浴びてきました。画像生成と言語モデルの両方は非常に優れており、生成された出力と実際のものを区別するのは困難です。 しかし、近年急速に進歩したのはこれらだけではありません。コンピュータビジョンの応用でも印象的な進歩が見られます。例えば、セグメンテーション・エニシング(SAM)モデルは、オブジェクトのセグメンテーションにおいて新たな可能性を開拓しました。SAMは画像またはより印象的にはビデオ内の任意のオブジェクトをトレーニング辞書に依存せずにセグメント化することができます。 ビデオ部分は特に興味深いです。ビデオは常に扱いにくいデータと考えられてきました。ビデオを扱う際には、どのようなタスクを達成しようとしているにせよ、モーショントラッキングが重要な要素となります。これが問題の基礎です。 モーショントラッキングの重要な要素の1つは、ポイントの対応関係を確立することです。最近では、動的なオブジェクトと移動カメラを持つビデオでのモーション推定を行うための複数の試みがありました。この難しいタスクでは、ビデオフレーム全体の2Dポイントの位置を推定し、基礎となる3Dシーンポイントの投影を表現します。 モーション推定の2つの主要なアプローチは、オプティカルフローとトラッキングです。オプティカルフローはビデオフレーム内のすべてのポイントの速度を推定し、トラッキングはポイントの運動を統計的に独立したものとして推定します。 近代的なディープラーニング技術により、ポイントトラッキングは進歩していますが、追跡されたポイント間の相関関係という重要な側面が見落とされています。直感的には、同じ物理的なオブジェクトに属するポイントは関連しているはずですが、従来の方法ではそれらを独立して扱ってしまい、誤った近似値を導くことになります。この問題に取り組むCoTrackerの登場です。 CoTrackerは、追跡されたポイント間の相関関係を考慮することで、長いビデオシーケンスでのポイントトラッキングを革新しようとするニューラルネットワークベースのトラッカーです。このネットワークはビデオと変動する数の開始トラック位置を入力とし、指定されたポイントの完全なトラックを出力します。 CoTrackerは複数のポイントの共同トラッキングをサポートし、ウィンドウアプリケーションでより長いビデオを処理することができます。トランスフォーマーベースのネットワークは、時間を1つの次元、トラッキングポイントをもう1つの次元とする2Dグリッド上で動作し、適切なセルフアテンション演算子を使用することで、各トラックをウィンドウ内でまとめて考慮し、トラック間で情報を交換し、それらの固有の相関関係を活用することができます。 CoTrackerの概要。出典:…

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us