Learn more about Search Results A - Page 318

AIを活用した「ディープフェイク」詐欺:ケララ州のスキャマーに対する継続的な戦い

最近数ヶ月間、ケララではAIによる「ディープフェイク」技術を悪用した巧妙な詐欺の増加が目撃されています。300人以上が驚異的な4000万ルピーを詐欺師に奪われ、この州は新たなサイバー犯罪の波と闘っています。AI詐欺は、魅力的な「在宅勤務」と「在宅ビジネス」の機会で脆弱な被害者を狙います。この記事では、これらの詐欺師の手口、彼らがディープフェイク技術をどのように利用するか、およびケララ州警察がこの脅威に対抗するための取り組みについて詳しく調査します。 また読む:サイバー犯罪者がWormGPTを使用してメールセキュリティを侵害する 詐欺の増加 警察の報告によると、報告されている事件だけでも件数はかなり高い可能性があります。詐欺行為が横行している州のリストのトップには、オンラインの詐欺師が月に約1億ルピーをケララの住民からだまし取っているケースがあります。驚くべきことに、女性や主婦がこれらの詐欺の主な標的となっています。 また読む:AIを活用したサイバー犯罪ツール「FraudGPT」の驚異的な増加 「在宅勤務」詐欺の魅力 犯罪者はWhatsAppやFacebookを通じて接触し、在宅での仕事の機会を提供します。そして、ビジネスの動画を見ることで報酬を得るという約束で被害者を誘惑します。しかし、餌はすぐに罠となり、被害者はタスクのウェブに巻き込まれ、最終的には莫大な金銭要求に直面することになります。 巧妙なビジネス詐欺 別の詐欺スキームでは、主要ブランドの製品を売りつけ、見逃せないお得な取引で被害者を誘惑します。犯罪者は本物の取引の幻想を作り出し、大きな購入の機会を提供する前に信頼を築きます。被害者はすぐに裏切られたと感じ、詐欺に関与したソーシャルメディアグループが消えてしまうことに気付きます。 また読む:犯罪者がAIを使って身内の振りをする ディープフェイク技術の脅威 ケララ州警察は最近、詐欺師がAIによる「ディープフェイク」技術を使って40,000ルピーを騙し取った事件を調査しました。詐欺師は元同僚になりすまし、ビデオ通話を通じて捏造された緊急医療事態のために被害者にお金を送金するように巧妙に操作しました。この洗練された戦術は、法執行機関にとって被疑者の追跡と逮捕の大きな課題となっています。 また読む:AIの時代にディープフェイクを検出・対処する方法 ケララ州警察の正義の追求 コーリコード市のサイバーポリスは迅速な行動を起こし、ディープフェイク事件で容疑者の追跡のためにアフマダーバードにチームを派遣しました。調査では、犯罪で使用されたシムカードを登録するために詐欺師が使用したというゴアのカジノに登録された住所の正当性を評価しています。ケララ州警察はグジャラート州警察の協力を求め、犯罪者を裁判にかける決意を持っています。 また読む:EUがディープフェイクとAIコンテンツの特定策を求める 私たちの意見 AIによる「ディープフェイク」詐欺の増加は、個人と彼らの苦労して稼いだお金に深刻な脅威をもたらしています。被害者の数が増え、財政的な損失が増大するにつれ、ケララの法執行機関はこの悪質な形態のサイバー犯罪に対抗するための努力を強化しています。先進技術の時代において、情報の知識とオンラインでのやり取りに警戒心を持つことは、これらの詐欺スキームから自分自身を守るための重要なツールとなります。市民は情報を得て、オンラインでのやり取りに注意を払うことで、詐欺師の悪意を阻止し、デジタル世界をより安全な場所にすることができます。

「2023年の会計のためのトップAIツール」

VIC.AI Vic.aiはAIを使用して財務管理を行います。数億の請求書を使用してアルゴリズムをトレーニングしたため、テンプレートや暗記を必要とせずに請求書から重要な情報を抽出することができます。彼らのアルゴリズムは運用初日からほぼ完璧なヘッダー結果を生成し、その技術は常に進化しています。彼らはAutopilotテクノロジーを使用してさまざまな請求の管理にAIを簡単に実装できます。 INDY Indyは人手作業よりも20倍速く煩雑な会計業務を終了させる人工知能(AI)プログラムです。商業活動は効率化され、プラットフォームは必要なすべての申告書を自動的に生成します。Indyのアドバイザーは、Indyのスタッフがキャリアのすべての段階でサポートします。これは、BNC(非商業利益)およびマイクロBNC制度に基づいて所得税を支払う事業、SAS、SASU、EURL、SARL、SELASU、SELARLで年間売上高が247K€未満の法人、マイクロ企業(自営業者)および所得税(IR)および法人税(IS)を支払うSCIなどに適していますが、付加価値税はありません。 Docyt DocytはAI技術を活用したクラウドベースの会計自動化ソフトウェアで、取引のコード化、仕訳の作成、QuickBooksでの銀行口座およびクレジットカード口座の調整などの業務を自動化します。チームのメンバーやクライアントは任意の場所からリアルタイムの財務情報を共有し、協力して作業することができます。財務データをデジタル化し、手順を自動化することで、簿記およびその他の管理コストを削減することができます。その結果、企業はタイムリーかつよく考えられた意思決定を行いやすくなります。 Blue Dot 従業員による財務取引に関して、Blue Dotはプラットフォームベースの常に最新のプラットフォームで市場に先駆けて参入しました。Blue Dot Tax Compliance Platformは、デジタル化、税務コンプライアンス、自動化を通じて会社の従業員支出データを付加価値税、課税対象従業員手当、法人所得税の処理と分析するためのオールインワンソリューションです。 Truewind.ai 新しいビジネスが頼るには、手作業の簿記システムは人為的なミスのリスクが大きすぎます。truewind.aiは、人工知能によって支えられたファイナンスおよび会計プラットフォームがこれらの問題を解決するのに役立つと見つけました。スタートアップや中小企業は、truewind.aiというAI駆動の財務自動化プラットフォームを利用してインテリジェントな会計サービスを受けることができます。取引、勘定の調整、リアルタイムの財務レポートは、機械学習アルゴリズムを使用して自動化されます。このクラウドベースのソフトウェアは、自動請求機能、キャッシュフロー予測および予算ツール、パフォーマンスメトリクスの追跡のためのカスタマイズ可能なダッシュボードにより、起業家が財務管理に時間とエネルギーを節約するのに役立つかもしれません。 Booke AI Booke AIは、忙しいプロフェッショナルのために会計プロセスを効率化するためのAIパワードの自動化ツールです。機能には、請求書、請求書、領収書からのリアルタイムOCRデータの抽出、自動トランザクションの分類、AI支援の調整があります。ユーザーは、Xero、QBO、QBDの統合を介してプラットフォームに好みの会計ソフトウェアを接続することができます。Booke AIのコミュニケーション機能は、チームワークの効果を向上させ、顧客との対話を改善します。文書は一括管理され、不一致が見つかり修正され、動的なレポートが生成されます。Booke AIは、XeroとQuickBooksのためのChrome拡張機能も提供しており、トランザクションをカテゴリに分類し、未識別の銀行フィードトランザクションをフラグ付けするのがより簡単になります。 Gridlex Sky…

メタが「AudioCraft」を発表:テキストを音声や音楽に変換するためのAIツール

Metaは、Facebook、Instagram、WhatsAppなどのソーシャルメディアプラットフォームを展開しているテックジャイアントであり、新たなオープンソースのAIツールであるAudioCraftをリリースしました。この革命的なツールは、プロのミュージシャンだけでなく、一般のユーザーにも力を与え、単純なテキストの指示を魅力的なオーディオや音楽作品に変えることができます。使いやすいインターフェースと多様な機能を備えたAudioCraftは、音声生成の世界を革新することを目指しています。 また、AIによる音楽生成の世界を探索する AudioCraftの背後にいる3人のミュージシャン AudioCraftには、その魔法の土台となる3つのパワフルなモデルがあります: MusicGen、AudioGen、EnCodecです。 MusicGenは、Metaの広大な音楽ライブラリからインスピレーションを得て、単なるテキスト入力から心を揺さぶるメロディを生成するためにその広範なトレーニングを活用します。一方、AudioGenは公開されている効果音の力を利用して、テキストの指示に基づいて鮮やかな音響体験を呼び起こします。そして、忘れてはならないのが、EnCodecデコーダーはより高品質な音楽生成と、不要なアーティファクトの最小化を実現するために着実な改善が行われています。 AudioGenモデルの解放 Metaは、事前にトレーニングされたAudioGenモデルをユーザーにアクセス可能にしています。これにより、音楽愛好家や音響愛好家は、車のクラクションが鳴り響くにぎやかな都市や、犬の吠え声や木製の床での足音が鳴り響く静かな森など、多様な環境音や効果音を創り出すことができます。これらのモデルによって、音楽作曲、効果音作成、圧縮アルゴリズム、そして無限の音声生成の可能性を秘めた創造性の扉が開かれます。 また、SoundStorm: Googleのオーディオモデルがオーディオ生成を席巻 オーディオのギャップを埋める 生成AIは、画像、動画、テキストの領域で大きな進歩を遂げてきましたが、オーディオはしばしば遅れてきました。AudioCraftは、このギャップを埋め、高品質なオーディオの生成プロセスを民主化することを目指して登場しました。Metaがツール、モデルの重み、およびコードをオープンソース化するという取り組みにより、研究者や実践者は個別のデータセットを使用して独自のモデルを作り上げることができます。 また、Metaがテキスト、画像、音声を同時にトレーニングしたAIモデルをオープンソース化 オーディオ生成の複雑さ Metaは、リアルな高品質なオーディオを作り出すことには困難があることを認識しています。画像やテキストとは異なり、オーディオはさまざまなスケールで複雑な信号やパターンを解読することを必要とします。特に音楽は、ローカルとロングレンジのパターンの両方を構成することから、独特な課題を提供します。しかし、AudioCraftを使用することで、これらの障壁が取り払われ、オーディオ生成の探求と実験が可能となります。 また、AudioPaLM: Googleの言語モデルの画期的な導入 魅惑的なメロディとその先へ AudioCraftは、単なる短い音楽の断片にとどまらず、魅力的なオーディオを長時間にわたって作り出すことができます。心を揺さぶる交響曲や遠くの場所にユーザーを運ぶアンビエントサウンドなど、このツールはシームレスな体験を約束します。直感的なインターフェースと多目的な応用により、AudioCraftは私たちがオーディオと音楽との関わり方を再定義する準備ができています。 また、AIが生成した楽曲がバイラルヒット 私たちの意見 MetaのAudioCraftは、新たなオーディオの生成と作曲の時代を切り拓くゲームチェンジャーです。AIの能力を使いやすくアクセス可能に組み合わせることで、このツールはミュージシャン、クリエイター、愛好家が今までにないような音とメロディを形成する力を与えます。オープンソースのアプローチにより、Metaは革新者のコミュニティを育み、生成オーディオ技術の進化を推進しています。AudioCraftは無限の可能性を開放し、想像力と現実の間の調和のとれた交響曲を創り出します。

「40以上のクールなAIツールをチェックアウトしましょう(2023年8月)」

DeepSwap DeepSwapは、説得力のあるディープフェイクのビデオや画像を作成したい人向けのAIベースのツールです。ビデオ、写真、ミーム、旧作映画、GIFなど、さまざまなコンテンツをリフェイシングして簡単にコンテンツを作成することができます。アプリにはコンテンツの制限がないため、ユーザーはどんなコンテンツでもアップロードすることができます。さらに、初めて製品のサブスクライバーになると、50%オフで利用できます。 Aragon Aragonを使用して、簡単に見栄えの良いプロフェッショナルなヘッドショットを手に入れましょう。最新のAI技術を活用して、瞬時に自分自身の高品質なヘッドショットを作成します!写真スタジオの予約やドレスアップの手間を省きましょう。写真の編集や修正も迅速に行われます。次の仕事を得るためにあなたに優位性を与えるHD写真40枚を受け取りましょう。 AdCreative.ai AdCreative.aiを使用して、広告やソーシャルメディアのゲームを向上させましょう。究極の人工知能ソリューションであるAdCreative.aiを使用すると、数秒で変換率の高い広告やソーシャルメディアの投稿を生成することができます。AdCreative.aiを使って、成功を最大化し、努力を最小限に抑えましょう。 Otter AI 人工知能を活用したOtter.AIは、共有可能で検索可能でアクセス可能で安全なリアルタイムの会議の議事録を提供します。音声を記録し、メモを書き、スライドを自動的にキャプチャし、要約を生成する会議のアシスタントを手に入れましょう。 Notion Notionは、高度なAI技術を活用してユーザーベースを増やすことを目指しています。最新の機能であるNotion AIは、ノートの要約、会議でのアクションアイテムの特定、テキストの作成と変更などのタスクを支援する強力な生成AIツールです。Notion AIは、退屈なタスクを自動化し、ユーザーに提案やテンプレートを提供することで、ワークフローを効率化し、ユーザーエクスペリエンスを簡素化し、改善します。 Docktopus AI Docktopusは、100以上のカスタマイズ可能なテンプレートを備えたAIパワープレゼンテーションツールで、数秒でプロのプレゼンテーションを作成することができます。 SaneBox AIは未来ですが、SaneBoxでは、AIが過去12年間にわたって電子メールを成功裏に支えており、平均ユーザーの週間の受信トレイ管理時間を3時間以上節約しています。 Promptpal AI Promptpal AIは、ChatGPTなどのAIモデルを最大限に活用するための最適なプロンプトをユーザーに提供します。 Quinvio AI…

「生成AI技術によって広まる気候情報の誤情報の脅威」

「生成AIが気候の誤情報を広げる方法を探求し、気候論議への影響に対抗するための具体的な戦略を学びましょう」

「InstagramがAIによって生成されたコンテンツにラベルを付けるようになりました」

人気のあるソーシャルメディアアプリInstagramは、プラットフォーム上のコンテンツを認識する方法を革新する画期的な機能を開発中です。アプリの研究者であるアレッサンドロ・パルッツィ氏が、AIが投稿の作成に関与した際にそのことを開示する予告の証拠を明らかにしました。この動きは、Instagramの親会社であるMetaがGoogleやMicrosoftなどの他のAI大手と協力して、責任あるAI開発を推進することを表しています。AIによる誤情報が増えている中、この新しいラベリングシステムは透明性を高め、ジェネラティブAIを使用して作成されたコンテンツをユーザーが特定できるようにすることを目指しています。 また読む:MITのPhotoGuardがAIを使ってAI画像操作に対抗 AIラベルの解読 アレッサンドロ・パルッツィ氏のスクリーンショットには、「このコンテンツはMetaのAIによって作成または編集されたと、作成者またはMetaが述べました。」という通知が表示されています。この開示は明示的にコンテンツをMetaのAI技術に帰属させています。ジェネラティブAIの簡単な説明が続き、ユーザーがAIの支援を受けた投稿を特定するためのガイドが示されます。この通知は、Metaが透明性と責任あるAI技術の使用にコミットしていることを示すものです。 Metaの責任あるAI開発への取り組み MetaやGoogle、Microsoft、OpenAIなどの主要なプレーヤーは最近、サイバーセキュリティと差別研究への投資を白宮に誓いました。また、AIによって生成されたコンテンツにウォーターマーキングシステムを開発することも約束しています。このウォーターマーキングシステムは、AIによって作成または編集されたコンテンツをユーザーに通知し、責任と認識を促進することを目指しています。 また読む:4つのテック巨人 – OpenAI、Google、Microsoft、Anthropicが安全なAIを目指して結束 自動化の要素 Instagramのラベリングシステムの具体的な仕組みは明らかにされていませんが、通知に「Metaが述べました」という表現があることから、テック企業による積極的な適用が示唆されています。これは、MetaがAIによって生成されたコンテンツを特定する意思があることを示しており、ユーザーが同様の開示をする負担を軽減することになります。ただし、具体的な自動化の範囲は不明であり、Metaからのさらなる詳細が待たれています。 また読む:Breaking News: Stack OverflowとStack Exchange Networkで大規模な抗議活動が発生 AIによる誤情報の脅威 AIによって生成される誤情報の出現は、オンラインプラットフォームに重大な課題をもたらしています。ペンタゴンの爆発の写真など、ウイルス性のある画像の例は、潜在的な危険性を警告しています。シンプルなAIツールは、衛星画像や政治写真に適用されると危険な誤情報を広めることができます。このラベリングシステムは、このような課題に対抗するための重要な一歩です。 また読む:PoisonGPT: Hugging Face LLMがフェイクニュースを広げる MetaのAIの進化と将来の機能…

「CREATORと出会ってください:ドキュメントとコードの実現を通じて、LLMs自身が自分のツールを作成するための革新的なAIフレームワーク」

大規模言語モデル(LLMs)は、最近の数年間で大きな進歩を遂げています。GPT-3、Codex、PaLM、LLaMA、ChatGPT、そしてより現在のGPT4などのモデルにより、LLMsの潜在能力は、インコンテキスト学習、コード生成、および他のさまざまなNLPタスクにおける優れたパフォーマンスにより、人工一般知能に対してますます近づいています。これらの印象的な成果にもかかわらず、現在のLLMsにはいくつかの欠点があります。例えば、現在の情報を認識または反応することができない、正確で理解しやすい数学的な解決策を提供することが頻繁に失敗する、長い論理連鎖で推論の不安定性などです。これらの問題を解決するために、LLMsに外部ツールを提供する研究が行われています。たとえば、ウェブ検索エンジンや質問応答(QA)システムなどのツールを含めることで、LLMsは問題解決に外部リソースをいつ、どのように使用するかを学ぶことができます。最近の研究では、GitHubのリソース、ニューラルネットワークモデル(Huggingfaceモジュールなど)、コードインタプリタ(Pythonインタプリタなど)など、追加の外部LLMツールも使用されています。これらの技術を使用して複雑な問題を解決する前に、LLMsは詳細な設計図を提供する必要があります。 図1は、CREATORが一般的なツール使用フレームワークと異なることを示しています。 ツール拡張型LLMsは、それにもかかわらずいくつかの困難に直面しています。特に以下の領域に注目しています:(1)潜在的な革新的なタスクのバラエティは本質的に無限ですが、現在の作業は一部のツールに集中しています。そのため、新しい問題を解決するために適切な既存のツールを見つけることは困難かもしれません。 (2)言語モデルの現在のツール使用方法は、本質的に複雑です。タスク処理全体には、モデルに重い認知的負荷をかけ、高い学習コストが必要です。 (3)実行結果を受け取った後、ツール使用パイプラインには定義された自動エラー処理メカニズムが欠けています。フレームワークの精度と堅牢性はまだ改善が必要です。この研究では、清華大学とイリノイ大学(UC)の研究者が、新しい視点からこれらの障害に取り組むことを意図しています。彼らはLLMsにツールの開発者になり、既存のパラメータに基づいてツールを作成し、特定の問題に取り組む能力を強化します。LLMsをツールの消費者としてではなく、ツールの開発者として活用するのです。 その結果、彼らはCREATORと呼ばれるツール開発フレームワークを導入します。このフレームワークは、LLMsの抽象的な推論能力を問題に基づいて利用して、既存のパラメータに応じてツールを作成および修正します。彼らは図1でCREATORと典型的なツール使用フレームワークのパイプラインの違いを示しています。ツール使用フレームワークは、推論を使用してAPIの選択と計画の効果的な使用方法を選ぶ方法に焦点を当てています。それに対して、彼らの焦点はツールセットの多様化、異なるレベルの合理性の切り離し、およびフレームワークの弾力性と正確性の向上です。 CREATORは以下の4つのステップに分けることができます: • 作成:問題に基づいて抽象的な推論を利用し、ドキュメントとコード実現を通じて広く適用可能なツールを作成します。  • 決定:適切なツールを使用していつ、どのようにツールを適用するかを選択します。  • 実装:LLMが問題を解決するためにツールを使用するプログラムを実行します。  • 修正:実行の結果に基づいて、ツールと選択を変更します。  彼らはまず、既存のベンチマークであるMATHとTabMWPを使用してCREATORでのテストを実施し、その設計がどれだけ成功しているかを確認します。TabMWPは問題解決のためのさまざまな表形式を提供し、MATHデータセットには難解で多様な数学の競技課題が含まれています。特に、CREATORを基に構築されたChatGPTは、従来の思考連鎖(CoT)、思考プログラム(PoT)、およびツール使用のベースラインを大幅に上回り、MATHデータセットでは平均正確度59.7%、TabMWPデータセットでは平均正確度94.7%を達成しています。 彼らはまた、ツール作成の評価に特化していない既存のベンチマークではなく、既存のツールやコードパッケージを使用して回答する必要のある革新的で困難なチャレンジからなるCreation Challengeデータセットを提案しています。このデータセットを使用して、LLMsのツール作成能力の価値と使用法を示し、ツール開発が知識の転送を促進し、LLMsがさまざまな問題文脈に効果的に適応できるようにするさまざまなツール製作の能力を持っていることを実験結果とケーススタディで示しています。

アバカスAIは、新しいオープンロングコンテキスト大規模言語モデルLLM「ジラフ」を紹介します

最近の言語モデルは長い文脈を入力として受け取ることができますが、それらが長い文脈をどれだけ効果的に使用しているかについてはさらなる知見が必要です。LLMsは長い文脈に拡張することができるのでしょうか?これは未解決の問いです。Abacus AIの研究者たちは、Llamaというモデルの文脈長の能力を開発するためのさまざまな手法を用いた実験を行いました。このモデルは、文脈長2048で事前学習されています。彼らはこれらのモデルをIFTを用いてスケール4および16で線形にスケールアップしました。モデルをスケール16にスケールアップすると、16kの文脈長または20-24kの文脈長までのワールドタスクを実行することができます。 文脈長を拡張するための異なる手法には、線形スケーリング、回転位置埋め込み(RoPE)のフーリエ基底のスケーリング、フーリエ基底の切り捨て、および位置ベクトルのランダム化があります。Abacus AIの研究者たちは、これらの手法を実装することでRedPajamaデータセットとVicunaデータセットを組み合わせてfine-tuningしました。彼らは、線形スケーリングは堅牢であるが、モデルの文脈長を増加させることがわかりました。切り捨てとランダム化はパープレキシティのスコアが高いが、リトリーバルタスクでは性能が低い結果となりました。 これらのモデルの評価には、LMSys、オープンブックの質問応答データセット、およびWikiQAからのデータセットを使用しました。LMSysデータセットは、文脈内の部分文字列を特定するために使用されました。WikiQAタスクは、Wikipediaのドキュメント内の情報に基づいて質問に答えるタスクです。 チームは、Google Natural Questionsのショートアンサーフォーマットデータに基づいたQAタスクを構築しました。出力は、元のドキュメントからコピー&ペーストした短い単語の回答だけであることを保証しています。これにより、LLMがどこを参照する必要があるのかを正確に特定することができ、回答を異なる位置に配置することで拡張された文脈長の各部分を効果的に評価することができます。彼らはまた、異なるサイズの同じWikipediaドキュメントの複数のバージョンを作成し、モデルのサイズにわたる公平な評価を行うことができました。 Wikipediaベースのデータセットの問題点は、モデルが事前学習されたテキストから回答を出力してしまうことです。研究者たちは、数値の回答のみを持つ質問からなる変更されたデータセットを作成することで、この問題を解決しました。彼らは回答とドキュメント内のすべての出現箇所を異なる数字に変更しました。これにより、モデルが事前学習テキストから再現する場合に誤った回答をするようになります。元のQAタスクをFree Form QA(FFQA)とし、変更されたタスクをAltered Numerical QA(AltQA)としました。 AbacusAIの研究者たちは、QAタスクの両バージョンのすべての例における存在精度を評価しました。存在精度は、モデルの生成された解答に回答が部分文字列として存在するかどうかを測定する指標です。彼らは、IFTによる精度の向上がモデルが達成できる文脈長の範囲を拡張しないことを観察しました。 研究者たちは、スケールされた文脈とIFTの組み合わせによる性能の飛躍的な向上を示しています。彼らは、スケールされた文脈ファクターによって補間されたすべての位置で、FFQAでは2倍、AltQAでは2.5倍の改善を観察しました。最後に、彼らの研究は、テーマをより良く捉え、より簡単に表現することができるより大きな文脈の言語モデルを提案しています。

「OpenAIがDall E-3を発売!次世代AIイメージ生成器!」

AI画像生成の世界では、OpenAIは最新作のDall E-3で華々しい登場を準備しています。テキストから画像を生成するモデルであるDall E-2の成功後、少し休憩を取っていましたが、彼らは見事な戻りを果たしました!新たな改良された機能を備えたDall E-3は、AI画像生成レースで一気に進出する予定です。この革新的なツールがどのようなものを提供しているのか、のぞいてみましょう。 また読む:AIが退屈なQRコードを絵画に変える。今すぐチェック! 画像レースでの追いつき OpenAIは、Dall E-2のアップグレード版であるDall E-3のテストを熱心に行ってきました。400人の選ばれたユーザーには、招待制のエクスクルーシブプレビューへのアクセスが許可されています。YouTuberのMattVidProが新しいモデルの能力を披露し、ユーザーを驚かせて手に入れたがっています。一致した意見は、Dall E-3が競合他社のMidjourney V5.2およびStability Diffusion XLよりも、プロンプトの追従能力や異なるアートスタイルでの連続した写真のような画像の作成能力が優れているというものです。 また読む:Google、オープンソースコミュニティが言語モデルレースでテックジャイアントを追い越すことを恐れる 完璧を追求する静かな戦い OpenAIはDall E-3に静かに取り組んでおり、機能を微調整し、ユーザーフィードバックを求めてより鮮明でリアルな画像を作成しています。MidjourneyのクローズドソースモデルやStability Diffusionのオープンソース提供との比較により、OpenAIの最新モデルがどのようなものをもたらすかに対する期待が高まっています。最近リリースされたマルチモーダルAIであるGPT-4の登場により、Dall E-3の向上した機能の可能性は非常に高まっています。 また読む:Metaが「人間のような」デザイナーAIを画像のために発売 安全第一 – 責任あるAIガバナンス OpenAIは、責任あるAIガバナンスを確保することに取り組んでおり、Microsoft、Google、Metaなどの他のテクノロジージャイアントと協力して、AI生成の音声および視覚コンテンツに透かしを入れることを約束しています。この透かし入れは業界において画期的な一歩となる可能性がありますが、テスト版にはまだ存在していません。テストフェーズでのセーフティ機能の欠如は、モデルがプロンプトなしでグラフィックや露骨なコンテンツ、著作権保護されたアートワークやロゴを生成する可能性があるため、懸念が高まっています。…

「非常にシンプルな数学が大規模言語モデル(LLMs)の強化学習と高次関数(RLHF)に情報を提供できるのか? このAIの論文はイエスと言っています!」

人間の入力を取り入れることは、ChatGPTやGPT-4などの大規模言語モデル(LLM)の能力の近年の印象的な向上の鍵要素です。人間のフィードバックを効果的に活用するためには、人間の好み、価値観、倫理的な問題を組み込んだ報酬モデルをまず訓練する必要があります。その後、報酬モデルの指示の下で強化学習を用いてLLMを調整します。この手順は、人間の目的とLLMを成功裏に調整し、対人間コミュニケーションの質を大幅に向上させるものです。 人間の好みに基づいた機能的な報酬システムを作成するのは簡単ではありません。特に、人間のラベラーが特定のプロンプトに対して数値の評価を提供できない場合、課題となります。代わりに、品質に関する補完についてのペアワイズ比較は、人々にとってははるかに簡単です。InstructGPTの作成においてもこのアプローチが使用されました。具体的には、人間のラベラーは同じプロンプトに対してLLMによって生成された多くの補完を示した後、品質が最も高いものから最も低いものまで並べます。 その後、補完は、人間の好みのランクにほぼ近いように訓練されたニューラルネットワークによって開発された報酬モデルに基づいて報酬を受けます。順位付けは、キャリブレーションの問題を解消するなどの特定の利点がありますが、複数のプロンプトの異なる報酬分布を適切に反映していません。これにより、上位にランク付けされた補完が別の補完よりもどれだけ優れているかが明確になりません。一部のRLHFプロンプトは開放的であるか、つまりユーザーの履歴に依存しているため、報酬分布は広範囲にわたる可能性があります。したがって、この懸念は特に関連性があります。 一方、いくつかのプロンプトは閉じた形式であり、高いまたは低いスコアを受けるべき応答を生成します。これにより、報酬分布には約2つのポイントマス分布が生じます。最初の種類のプロンプトの例には、「ピタゴラスの定理を証明する」や「鶏は恐竜ですか」といったものがあります。2番目の種類の例には、「ピタゴラスの定理を証明する」と「100年後のAIの姿についての短編を書く」といったものがあります。プロンプトに関連する細微な手がかりを考慮に入れることで、報酬モデルはLLMが不確実性を適切に測定するのに役立つかもしれません。 スタンフォード大学、プリンストン大学、ペンシルベニア大学の研究者たちは、好みの順位に基づいて報酬モデルを訓練することで、プロンプトに独立した報酬分布を提供することができるという予期しない現象を文書化しています。この現象は、訓練の最後の段階で起こるもので、報酬の崩壊として知られています。興味深いことに、この現象は実証的に証明される前に、理論的な分析で予測されていました。彼らは、報酬の崩壊の報酬分布を数値的に推定するために、簡単な最適化プログラム、あるいはもっと簡単には閉形式の式を使用できることを示しています。報酬の崩壊の予測は、実証的な結果と非常に良い一致を示しています。 彼らの2番目の主要な貢献は、報酬の崩壊を防ぐためにその発生を予測するための同じ最適化プログラムからのデータを使用する原則的な戦略を紹介することです。報酬の崩壊は望ましくないものであり、異なるプロンプト間の微細な違いを無視する可能性があります。これにより、LLMが強化学習と報酬モデルを使用して訓練される際に、人間の選択の誤校正が生じる可能性があります。報酬モデルの訓練の早期終了は、この問題に対する単純な解決策ですが、かなり任意的であり、終了時期の決定が困難な場合があります。 要するに、彼らはプロンプトに基づいて異なるユーティリティ関数を使用して報酬モデルを訓練することを提案しています。これにより、結果として得られる報酬分布は、プロンプトが開放的な場合と閉じた形式の場合に応じて広範に分散するか、集中するかが決まります。このプロンプトに対応したテクニックは、報酬分布の構造を必要に応じて完全にカスタマイズすることができるという明らかな利点があります。彼らの研究結果は、このプロンプトに対応したテクニックを使用することで報酬の崩壊を大幅に減少させることができることを示しています。

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us