Search Results ML

「NTUシンガポールの研究者たちは、テキストから3D生成のための新しいプラグアンドプレイなリファインメントAIメソッドであるIT3Dを提案しています」

テキストから画像への領域で注目すべき進歩があり、研究コミュニティ内で3D生成への拡大に対する熱意の急増が起きています。この興奮は、事前学習された2Dテキストから画像への拡散モデルを利用する手法の出現によるものです。この領域で重要な進展となるのは、Dreamfusionによって行われた創造的な作業です。彼らはスコア蒸留サンプリング（SDS）アルゴリズムという新しい手法を導入しました。この手法は、テキストの指示だけで数多くの異なる3Dオブジェクトを作成できるため、大きな違いをもたらしています。革新的なアプローチであるにもかかわらず、ジオメトリとテクスチャの制御には制約があり、過飽和やモデルの多重顔のような問題がよく発生します。さらに、研究者は、テキストの指示を強化するだけではモデルをより良くすることはできないと気付いています。これらの課題に立ち向かうために、研究者たちはこの3D生成のための強化された手法を導入しました。この手法は、望ましい3Dモデルの異なる角度から複数の画像を作成し、これらの画像を使用して3Dオブジェクトを再構築することに焦点を当てています。このプロセスは、DreamFusionなどの既存のテキストから3D生成モデルを使用して、オブジェクトの基本的な表現を作成することから始まります。これらの初期モデルを作成することで、オブジェクトの形状と空間内での配置の基本的な理解を得ることができます。その後、この手法は画像から画像への生成プロセスを使用して、ビューの画像を改善します。 IT3Dは、メッシュやNeRFなどの異なる3D出力表現に対する支援を提供し、テキスト入力を使用して3Dモデルの外観を効率的に変更する能力が追加の強みです。上記の画像はIT3Dのパイプラインを示しています。IT3Dは、粗い3Dモデルから始めて、まず画像から画像へのパイプラインを活用して小さなポーズデータセットを生成します。次に、ランダムに初期化された識別器を組み込み、生成されたデータセットから知識を蒸留し、識別損失とSDS損失を使用して3Dモデルを更新します。さらに、分析からは、この手法が訓練プロセスを高速化し、必要な訓練ステップを減らし、合計の訓練時間を比較可能にすることが示されます。この手法は、上記の画像からもわかるように、高い分散データセットにも耐えることができます。最後に、経験的な結果は、提案された手法がテクスチャの詳細、ジオメトリ、およびテキストプロンプトと生成された3Dオブジェクトとの忠実度の点でベースラインモデルを大幅に改善することを示しています。この技術は、テキストから3D生成に関する新しい視点を提供し、GANと拡散事前学習を組み合わせた最初の研究作業となりました。

「PDF、txt、そしてウェブページとして、あなたのドキュメントと話しましょう」

LLMsを使用してPDF、TXT、さらにはウェブページなどのドキュメントに質問をすることができるウェブと知能を作成するための完全ガイド

効率的な開発者ですか？それならAIがあなたの仕事を狙っています

開発における人間とAIの利点は、効果と効率の一致によるものです前者は曖昧で主観的ですが、後者は議論の余地がなくデータに基づいています

このAI論文は、さまざまなディープラーニングと機械学習のアルゴリズムを用いた行動および生理学的スマートフォン認証の人気のあるダイナミクスとそのパフォーマンスを識別します

年月が経つにつれて、モバイルデバイスは機能性と人気の面で大きな進化を遂げてきましたが、セキュリティ対策はそれに追いついていません。スマートフォンには今や大量の機密情報が含まれており、セキュリティは切迫した問題となっています。研究者たちは、モバイルデバイスのセキュリティ強化のために行動および生理学的なバイオメトリクスを探求しています。これらの方法は、タイピングパターンや顔の特徴など、ユーザー固有の特性を活用しています。機械学習とディープラーニングのアルゴリズムを組み込むことで、セキュリティの強化に有望な成果が示されています。これらのアプローチを現実のシナリオにおいてモバイルデバイスのセキュリティを向上させるために、さらなる研究が重要です。この文脈において、アメリカの研究チームによって新しい論文が発表されました。この論文は、モバイルデバイスにおけるセキュリティギャップの拡大に対処するために、行動および生理学的なバイオメトリクスに基づく認証方法がスマートフォンのセキュリティをどのように向上させるかを包括的にレビューすることを目的としています。これは、この分野での以前の研究を基にしており、認証のダイナミクスにおけるトレンドを特定しています。さらに、研究では、ディープラーニングの特徴とディープラーニング/機械学習の分類を組み合わせたハイブリッド方式が、認証のパフォーマンスを大幅に向上させることができることを強調しています。この研究は、モバイルデバイスのセキュリティの重要な側面について詳しく掘り下げるとともに、次の主要な問いに焦点を当てています。「モバイルデバイスにおける最も効果的な生体認証方法は何であり、これらの生体認証方法にはどの機械学習およびディープラーニングのアルゴリズムが最適ですか？」著者たちは、生体認証の文脈におけるディープラーニング（DL）および機械学習（ML）のアルゴリズムに関する包括的な調査が重要な知見を提供したと結論づけました。彼らは、アルゴリズムの慎重な選択が認証のパフォーマンスに大きく影響することを発見しました。畳み込みニューラルネットワーク（CNN）と再帰型ニューラルネットワーク（RNN）は、生理学的および行動的なダイナミクスの処理においてリーダーとなっています。CNNは、顔や指紋に基づく生体認証などの生理的データの処理に優れており、RNNはキーストロークのダイナミクスにおいて非常に貴重です。サポートベクターマシン（SVM）は、特にタッチ、動き、およびキーストロークのダイナミクスにおける行動的なバイオメトリクスの分類において堅牢な選択肢でした。研究はまた、CNNなどのアルゴリズムを特徴抽出に使用するハイブリッド認証システムの採用の増加にも言及しています。CNN + LSTMによる歩行ダイナミクスやCNN + SVMによる顔認証などのこれらのハイブリッドアプローチは、さまざまなシナリオでの認証パフォーマンスの向上に有望です。最後に、この論文は、レビューされた研究にいくつかの制約があることも強調しています： 1. 小規模なデータセット：多くの研究は小規模なデータセットを使用しており、特により大きなデータ量を必要とするディープラーニングモデルの品質と一般化能力に支障をきたす可能性があります。 2. セキュリティテストの欠如：多くの研究は、さまざまなセキュリティ攻撃に対するモデルのテストを行っていないため、認証方法が脆弱になる可能性があります。 3. 制約のあるシナリオ：一部の研究は、ユーザーが厳格な指示に従う制約のあるシナリオでデータを収集およびテストしています。これは、人々がデバイスを使用する方法の変動性を考慮していないため、モデルの現実世界での適用可能性を制限する可能性があります。これらの制約に対処することは、バイオメトリックモバイル認証方法の実用性とセキュリティの向上にとって重要です。まとめると、この調査はモバイルバイオメトリック認証の包括的な見方を提供しています。特にCNNとRNNのようなディープラーニングアルゴリズムが、行動的および生理学的な認証の両方で効果的であることを強調しています。CNN + SVMのようなハイブリッドモデルは、パフォーマンスの向上に有望です。論文の著者によれば、将来の研究ではDLアルゴリズムに焦点を当て、高品質なデータセットを拡充し、現実的なテストシナリオを確保することが、モバイルバイオメトリック認証の可能性を最大限に活用するために重要です。

コードのための大規模な言語モデルの構築とトレーニング：StarCoderへの深い探求

イントロダクションこんにちは、テック愛好家の皆さん！今日は、大規模な言語モデル（LLM）を構築してトレーニングする魅力的な世界について、皆さんをご案内します。この記事は、AIとコード開発の交差点に位置するオープンイニシアチブであるBigCodeプロジェクトの一部である、驚異的なモデルであるStarCoderについて、詳しく掘り下げていきます。始める前に、Hugging Faceの機械学習エンジニアであるLoubna Ben Allalさんに、この記事の基になった「コードのための大規模な言語モデルの構築」に関するデータアワーセッションに感謝を申し上げます。さあ、準備をして、この最先端のテクノロジーの魔法を探求しましょう！学習目標： BigCodeコラボレーションを通じたAIのコーディングにおけるオープンで責任あるプラクティスを理解し、透明性と倫理的な開発を重視します。 Megatron-LMなどのフレームワークを活用した、データの選択、アーキテクチャの選択、効率的な並列処理を通じたLLMトレーニングの基本を理解します。 BigCode評価ハーネスによって促進されるHumanEvalなどのベンチマークを使用したLLMの評価を探求し、効果的なモデル比較を実現します。 VS Codeの拡張機能などのツールを使用して、LLMを開発環境に実践的に統合し、倫理的なAI利用に合致させます。大規模言語モデルの力を解き放つでは、これらの大規模言語モデルについての話題は何でしょうか？それは、自然言語の説明に基づいてコードの断片を完成させたり、完全な関数を生成したり、バグ修正の洞察を提供したりする、仮想のコーディングの魔術師のような存在です。私たちのスターであるStarCoderは、155億のパラメータを誇り、優れたコード補完能力と責任あるAIの実践を示しています。データの選別と準備：成功の基盤では、秘密のソースであるデータの選別について話しましょう。私たちの旅は、GitHubのコードの大規模なコンパイルであるThe Stackデータセットから始まります。このデータセットは300以上のプログラミング言語にわたるものです。しかし、量が常に品質を上回るわけではありません。私たちは、人気と包括性を重視しながら、86の関連する言語を選び抜きました。ただし、ここで注意が必要です。詳細なクリーニングを経て、約80のプログラミング言語で約800ギガバイトのコードのみを残しました。この過程で、自動生成されたファイルや重複したコードを削除することで、モデルが繰り返しパターンを記憶しないようにしました。これにより、量よりも質を重視し、効果的なトレーニングが可能になりました。トークン化とトレーニング用のメタデータ：コードの解読次に、トークン化です！クリーンなテキストデータをモデルが理解できる数値入力に変換しました。リポジトリやファイル名などのメタデータを保持するために、各コード断片の先頭に特別なトークンを追加しました。このメタデータは、異なるプログラミング言語でコード断片を生成する方法をモデルに示す、道案内のようなものです。また、GitHubの課題、gitのコミット、Jupyterノートブックなども工夫しました。これらの要素は、特別なトークンで構造化され、モデルにコンテキストを提供します。このメタデータと書式設定は、後のモデルのパフォーマンスと微調整に重要な役割を果たします。 StarCoderのアーキテクチャの選択：新たな高みへのスケーリング StarCoderのアーキテクチャは、設計の選択肢の傑作です。私たちは、スピードとコスト効率を目指し、1550億のパラメータを選択しました。これは、パワーと実用性のバランスです。また、より大きなデータのバッチを効率的に処理し、品質を損なうことなく推論時間を高速化する技術であるマルチクエリアテンション（MQA）も取り入れました。しかし、イノベーションはそこで終わりませんでした。フラッシュアテンションによる大規模なコンテキスト長を導入しました。これにより、8000トークンまでスケーリングし、効率とスピードを保ちました。そして、双方向のコンテキストについて疑問がある場合は、StarCoderが左から右、右から左の両方のコード断片を理解する方法を見つけました。これにより、その柔軟性が向上しました。…

「ガードレールでLLMを保護する」

大規模言語モデル（LLM）アプリケーションの使用が一般化し、より大規模な企業に拡大するにつれて、本番環境における効果的なガバナンスの確立が明確に求められます

「ChatGPTは本当に中立なのか？AIによる対話エージェントの政治的バイアスに関する実証的研究」

イギリスとブラジルの研究者による最近の調査は、OpenAIが開発した人気のあるAI言語モデルであるChatGPTの客観性に関する懸念を明らかにしました。研究者たちは、ChatGPTの応答には明らかな政治的なバイアスがあり、政治的スペクトルの左側に傾いていることを発見しました。彼らはこのバイアスが、従来のメディアに存在する既存のバイアスを持続させ、政策立案者、メディア機関、政治団体、教育機関などの様々な利害関係者に影響を与える可能性があると主張しています。現在、ChatGPTは入力プロンプトに基づいて人間らしいテキストを生成するために使用される主要なAI言語モデルの一つです。さまざまなアプリケーションにおける多目的なツールとしての実績を示していますが、応答におけるバイアスの出現は重要な課題を提起しています。以前の研究ではAIモデルのバイアスに関する懸念が指摘され、公正でバランスの取れた出力を確保するためにこれらのバイアスを緩和することの重要性が強調されています。 ChatGPTの特定のバイアスに対応するため、イギリスとブラジルの研究者チームが、ChatGPTが政治的なコンパスの質問や、AIモデルが民主党員と共和党員の両方の人物像を演じるシナリオに対する応答を分析することを目的とした研究を発表しました。研究者たちはChatGPTの政治的な傾向を測定するために経験的な手法を採用しました。彼らはアンケートを使用してAIモデルの政治的な問題や文脈に対するスタンスを評価しました。さらに、ChatGPTが平均的な民主党員と共和党員の人物像を演じる場面も調査しました。研究の結果は、バイアスが機械的な結果ではなく、AIモデルの出力に意図的な傾向があることを示唆しています。研究者たちは、トレーニングデータとアルゴリズムの両方を調査し、観察されたバイアスに両方の要素が寄与していると結論づけました。研究の結果は、ChatGPTの応答におけるかなりのバイアスを示し、特に民主党寄りの視点を好む傾向があることを示しました。このバイアスは米国にとどまらず、ブラジルやイギリスの政治的文脈に関連する応答でも明らかになりました。この研究は、バイアスのあるAI生成コンテンツが様々な利害関係者に与える潜在的な影響を明らかにし、バイアスの源についてさらなる調査が必要であることを強調しています。 AIによるChatGPTなどのツールの影響力の増大を考えると、この研究は公正で偏りのないAI技術を確保するための警鐘となります。AIモデルのバイアスに対処することは、既存のバイアスを持続させずに客観性と中立性の原則を守るために重要です。AI技術がさまざまなセクターに進化し拡大するにつれて、開発者、研究者、利害関係者がバイアスを最小限に抑え、倫理的なAI開発を推進するために共同で取り組むことが不可欠となります。ChatGPT Enterpriseの導入は、AIツールが効率的だけでなく、バイアスのない信頼性のあるものであることを確保するための堅牢な手段の必要性をさらに強調しています。論文をご覧ください。この研究に関するすべてのクレジットは、このプロジェクトの研究者に帰属します。また、最新のAI研究ニュース、クールなAIプロジェクトなどを共有している29k+ ML SubReddit、40k+ Facebook コミュニティ、Discord チャンネル、およびメールニュースレターにぜひ参加してください。もし私たちの活動が好きなら、ニュースレターも気に入るでしょう。この記事は、AI駆動型の会話エージェントにおける政治的バイアスに関する経験的な研究についてのものです。MarkTechPostに最初に掲載されました。

「ベストプロキシサーバー（2023年9月）」

プロキシサーバは、コンピュータが自分自身の代わりにリクエストを行うためのネットワーク上で動作するアプリケーションまたはウェブサービスです。これは、お客様（あなた）とサービス（コンピュータ上で表示するウェブサイト）の間の仲介役として機能します。プロキシサーバは、ユーザがウェブを閲覧する際に実際のIPアドレスを隠すためによく使用されます。ブロックされているウェブサイトにアクセスできるようにするだけでなく、プロキシサーバは未成年者や労働者などのユーザを制限または監視する場合もあります。特定のウェブサイトへのアクセスを防ぐために設定されることもあります。データを盗み見から守ったり、オンラインで匿名になったり、コンテンツフィルタの効果を評価したりしながら、ネットワークの速度を向上させることができます。以下に、トップのプロキシサーバをリストアップします。 Bright Data Bright Dataは、ウェブデータの世界的なプラットフォームとして存在しています。フォーチュン500社から学術機関や中小企業まで、さまざまな組織がBright Dataの効率的で信頼性の高い柔軟なソリューションを利用して、主要な公共ウェブデータを収集しています。このデータは、研究、監視、データ分析、意思決定プロセスの向上に活用されます。Bright Dataは、195の国に広がる膨大な数のプロキシを誇り、99.99%という驚異的な成功率、7200万以上の実在する居住地IPの蓄積を誇ります。 Ake Akeは、最も信頼性と安定性に優れたレジデンシャルプロキシネットワークとして他とは異なる存在です。信頼性と信頼性のあるソース、大量のレジデンシャルIPアドレスのプールを通じて、顧客はさまざまな地理的なコンテンツにアクセスすることができます。150以上の異なる国にあるプロキシサーバに接続して選択することができます。米国、フランス、ドイツ、英国、オランダなど、多くの国でプロキシサーバが提供されています。アプリケーションテスト用のグローバルプロキシサーバは、650の場所と150の国で見つけることができます。 Live Proxies Live Proxiesは、プライベートなレジデンシャルおよびモバイルプロキシソリューションの業界基準を設定しています。最適な透明性と信頼性を保証しながら、多様なユースケースに対応する高品質で安定したプロキシを提供しています。回転および静的なレジデンシャルIP、回転するモバイルIPなど、さまざまなニーズに対応しています。これらのプロキシは排他的に割り当てられており、すべてのウェブサイトでのブロック解除が保証されています。また、強力なカスタマーサポートとカスタムソリューションもあり、その信頼性の高さに貢献しています。さらに、使いやすい管理ダッシュボードを使用してプロキシの分析を簡単に表示することができます。競争力のある価格から始まる柔軟なプランから選ぶことができるため、Live Proxiesは今日のデジタル主導の世界で貴重な資産です。 NodeMaven NodeMavenは、プロキシIPを割り当てる前にリアルタイムで高度なフィルタリングアルゴリズムを使用してIPをスクリーニングします。NodeMavenが提供するプロキシに接続すると、IPが割り当てられるまでに、高度な品質保証アルゴリズムを通過したIPのみが割り当てられます。これにより、IPの95%がクリーンな状態であることが保証されます。さらに、NodeMavenはハイブリッドプロキシ技術を使用しており、IPセッションを平均よりも長い24時間保持することができます。これにより、Facebook、Google、eBay、Amazon、LinkedInなどのプラットフォームでアカウントを管理するのに最適です。1400以上の都市と150以上の国で5百万以上のレジデンシャルIPを提供しています。また、有効期限の切れないロールオーバーバンド幅も提供しており、価格も非常に競争力があります。 IPRoyal IPRoyalは、195以上の国で数千のIPアドレスを持つ、倫理的に調達されたレジデンシャルプロキシのネットワークを提供しています。合計8056839個のレジデンシャルIPアドレスがプロキシプールに使用されています。IPRoyalを使用すると、世界中のどの国でも、実際の家庭ユーザーの実際のインターネットサービスプロバイダ（ISP）接続から本物のIPアドレスを取得できます。信頼性が重要なプロフェッショナルまたは個人の状況に最適です。 Nimble Nimbleを使用すると、単一のインターフェースから家庭、データセンター、インターネットサービスプロバイダなど、世界中のIPアドレスを使用することができます。このシステムはデータの利用可能性を向上させ、費用を削減し、難しい目標の達成を容易にします。Nimbleの使いやすいコントロールパネルは、他のプロキシサービスプロバイダとは異なります。ダッシュボードは、支出状況の把握や消費の追跡などに役立ちます。コントロールパネルを使用してパイプラインの設定、変更、削除も行うことができます。…

プロンプトからテキストを生成するためのモデルの作成

導入急速に進化するGenerative AIの風景において、新たな時代が訪れました。この変革的なシフトにより、AIアプリケーションに前例のない進歩がもたらされ、その最前線にはChatbotがあります。これらのAIパワードの対話エージェントは、人間のような相互作用をシミュレートし、ビジネスや個人のコミュニケーションを再構築しています。”Gen AI Era”という用語は、先進的なAIが未来を形作る役割を強調しています。”解放された可能性”は、Chatbotがパーソナライズされた体験、効率的な問題解決、創造性を推進する変革期を意味しています。タイトルは、Generation AIによってエンパワーされたChatbotが、新しい対話の時代を切り拓くために、プロンプトからテキストを生成するモデルをゼロから構築する方法を発見することを示唆しています。本記事では、ChatbotとGen AIの交差点で、プロンプトからテキストを生成することによる深い影響を明らかにしています。Chatbotがコミュニケーションを向上させ、プロセスを効率化し、ユーザーエクスペリエンスを向上させる方法について探求します。この旅は、異なる産業におけるGen AI時代におけるChatbotの潜在能力を解き放ち、その進化、応用、変革力を探求します。最先端のAIイノベーションを通じて、Chatbotがこのダイナミックな人工知能の時代において、対話、作業、つながりを再定義する方法を明らかにします。学習目標 Gen AI Eraの導入: Generation AI（Gen AI）の概念とその進化する人工知能の風景における重要性を説明して、舞台を設定します。 Chatbotの役割の強調: ChatbotがGen AIの枠組み内で果たす重要な役割を強調し、コミュニケーションと相互作用に与える変革的な影響を示します。 LangChainの洞察の探求: LangChainのブログ投稿「LangChain DemoGPT: Generation AIアプリケーションの新時代を切り拓く」について、ChatbotとGen…

「学生向けの最高のAIツール（2023年9月）」

人工知能（AI）は、教育においてさまざまな応用があります。インタラクティブなバーチャル教室の開発、”スマートコンテンツ”の生成、言語の壁の取り払い、知識のギャップの解消、そして各生徒に合わせた個別の授業計画の作成などです。学校のAI市場は、今後数十億ドル規模になると予想されています。教育体験のあらゆる側面を革新する潜在能力が、その急速な台頭に貢献しています。このため、いくつかの先見的なビジネスがAI技術を開発しています。学習環境で最も有用なAIアプリケーションのいくつかを探ってみましょう。 Gradescope Gradescopeは、学生が互いに評価やコメントを提供することで時間を節約するAIプログラムです。機械学習（ML）と人工知能（AI）がGradescopeの核心にあり、採点プロセスを効率化して時間と労力を節約します。教育者は、従来の評価、デジタル評価、課題、プロジェクトの採点を集中的に行うためにGradescopeを利用することができます。アウトソーシングにより、教育者はより重要な仕事に集中することができます。 Undetectable AI Undetectable AIは、AIコンテンツを優れた品質の人間によって書かれたコンテンツに変換する先端のツールです。AI検出器がコンテンツをフラグにすることを心配していますか？ Undetectable AIがあれば、それはあなたの新しい秘密の武器です。このツールを使えば、AIによって生成されたテキストを人間のような本物の自然なコンテンツに簡単に変換することができます。最も高度なAI検出器でも騙されるほどの本物のコンテンツを提供します。Undetectable AIは単なるコンテンツ作成ツールを超えており、市場で利用可能な最も高度なAI検出器リムーバーツールです。その独自のアルゴリズムは、テキストからすべての認識可能なAIの特徴を削除し、すべてのAI検出チェックを成功させるように設計されています。コンテンツ作成の制約を忘れてください。Undetectable AIを使えば、ツールだけでなく創造的な旅における完全な自由を手に入れることができます。このツールを使えば、AIコンテンツ検出器をバイパスすることができ、コンテンツがAI生成としてフラグ付けされたり識別される心配をする必要がありません。 Quizgecko Quizgeckoは、ビジネス、教育者、個々の学習者を対象としたAIパワードのオンラインテスト・クイズ作成ツールです。あらゆる言語で作業する能力を持つこのツールは、既存のコンテンツをカスタマイズ可能な評価に簡単に変換します。選択肢から穴埋め問題まで、ユーザーは簡単にクイズを作成、共有、埋め込むことができます。従業員のトレーニング、教室の指導、個別の学習に関わらず、Quizgeckoはプロセスを簡素化し、時間を節約し、関与を向上させます。 Aragon AI Aragonを使って、驚くほど簡単にプロフェッショナルなヘッドショットを作成しましょう。最新のAI技術を活用して、自分自身の高品質なヘッドショットを瞬時に作成します！写真スタジオの予約や着飾る手間を省略してください。写真の編集や修整も迅速に行われます。次の仕事を得るための優位性をもたらす40枚のHD写真を受け取りましょう。 Notion Notionは、高度なAI技術を活用してユーザーベースを拡大することを目指しています。最新の機能であるNotion AIは、ノートの要約、ミーティングでのアクションアイテムの識別、テキストの作成と編集などのタスクをサポートする強力な生成AIツールです。Notion AIは、煩雑なタスクを自動化し、ユーザーに提案やテンプレートを提供することで、ワークフローを効率化し、ユーザーエクスペリエンスを簡素化して改善します。 Hostinger AIウェブサイトビルダー Hostinger…

Learn more about Search Results ML - Page 282