Search Results EU

AIがトランスコミュニティに与える悪影響を明らかにする

AIがトランスジェンダーに失敗している方法ジェンダー認識ソフトウェアの危険性、不適切な医療モデル、トランスフォビックなコンテンツの増幅

一度言えば十分です！単語の繰り返しはAIの向上に役立ちません

大規模言語モデル（LLM）はその能力を示し、世界中で話題になっています今や、すべての大手企業は洒落た名前を持つモデルを持っていますしかし、その裏にはすべてトランスフォーマーが動いています...

マックス・プランク研究所の研究者たちは、MIME（3D人間モーションキャプチャを取得し、その動きに一致する可能性のある3Dシーンを生成する生成AIモデル）を提案しています

人間は常に周囲と相互作用しています。空間を移動したり、物に触れたり、椅子に座ったり、ベッドで寝たりします。これらの相互作用は、シーンの設定やオブジェクトの位置を詳細に示します。マイムは、そのような関係性の理解を利用して、身体の動きだけで豊かで想像力豊かな3D環境を作り出すパフォーマーです。彼らはコンピュータに人間の動作を模倣させて適切な3Dシーンを作ることができるでしょうか？建築、ゲーム、バーチャルリアリティ、合成データの合成など、多くの分野がこの技術に恩恵を受ける可能性があります。たとえば、AMASSなどの3D人間の動きの大規模なデータセットが存在しますが、これらのデータセットには収集された3D設定の詳細がほとんど含まれていません。 AMASSを使用して、すべての動きに対して信憑性の高い3Dシーンを作成できるでしょうか？そうであれば、AMASSを使用してリアルな人間-シーンの相互作用を考慮したトレーニングデータを作成できます。彼らは、MIME（Mining Interaction and Movement to infer 3D Environments）と呼ばれる新しい技術を開発しました。これは、3D人間の動きに基づいて信憑性の高い内部3Dシーンを作成して、このような問いに対応します。それを可能にするのは何でしょうか？基本的な仮定は次のとおりです。(1)空間を移動する人間の動きは、物の欠如を示し、実質的に家具のない画像領域を定義します。また、これにより、シーンに接触する場合の3Dオブジェクトの種類や場所が制限されます。たとえば、座っている人は椅子、ソファ、ベッドなどに座っている必要があります。図1：人間の動きから3Dシーンを推定します。3D人間の動き（左）から推定された、動きが起こったリアルな3D設定を再現します。彼らの生成モデルは、人間-シーンの相互作用を考慮した、複数のリアリスティックなシナリオ（右）を生成できます。ドイツのマックスプランク知能システム研究所とAdobeの研究者たちは、これらの直感を具体的な形で示すために、MIMEと呼ばれるトランスフォーマーベースの自己回帰3Dシーン生成技術を作成しました。空のフロアプランと人間の動きシーケンスが与えられると、MIMEは人間と接触する家具を予測します。さらに、人間と接触しないが他のオブジェクトにフィットし、人間の動作によって引き起こされる自由空間の制約に従う信憑性の高いアイテムを予測します。彼らは、人間の動きを接触と非接触のスニペットに分割して、3Dシーン作成を人間の動きに条件付けます。POSAを使用して接触可能なポーズを推定します。非接触姿勢は、足の頂点を地面に投影して、部屋の自由空間を確立し、2Dフロアマップとして記録します。 POSAによって予測された接触頂点は、接触ポーズと関連する3D人体モデルを反映した3D境界ボックスを作成します。接触と自由空間の基準を満たすオブジェクトは、トランスフォーマーへの入力として自己回帰的に期待されます。図1を参照してください。彼らは、3D-FRONTという大規模な合成シーンデータセットを拡張して、MIMEをトレーニングするための新しいデータセットである3D-FRONT HUMANを作成しました。彼らは、RenderPeopleスキャンからの静止接触ポーズと、AMASSからのモーションシーケンスを使用して、3Dシナリオに人を自動的に追加します（一連の歩行モーションと立っている人を含む非接触人と、座って、触れて、横たわっている人を含む接触人）。 MIMEは、3Dバウンディングボックスとして表される入力動作のリアルな3Dシーンレイアウトを推論時に作成します。彼らは、この配置に基づいて3D-FUTUREコレクションから3Dモデルを選択し、人間の位置とシーンの間の幾何学的制約に基づいて3D配置を微調整します。彼らの手法は、ATISSのような純粋な3Dシーン作成システムとは異なり、人間の接触と動きをサポートする3Dセットを作成し、自由空間に説得力のあるオブジェクトを配置することができます。Pose2Roomという最近のポーズ条件付け生成モデルとは異なり、個々のオブジェクトではなく完全なシーンを予測することができます。彼らは、PROX-Dのように記録された本物のモーションシーケンスに対して調整なしで彼らの手法が機能することを示しました。まとめると、彼らが提供したものは以下の通りです： • 人と接触するものを自動的に生成し、運動定義された空きスペースを占有しないように自己回帰的に作成する、3Dルームシーンの全く新しい運動条件付き生成モデル。 • RenderPeopleの静止接触/立ち姿勢からの3Dモーションデータを用いて、人と自由空間にいる人々が相互作用する3Dシーンデータセットが、3D FRONTを埋めるように作成されました。コードはGitHubで入手可能であり、ビデオデモとアプローチのビデオ解説も提供されています。

あなたのLLMアプリケーションは公開に準備ができていますか？

大規模言語モデル（LLM）は、現代の自然言語処理アプリケーションにおいてパンとバターとなり、固有表現認識モデルなどのより専門的なツールの多様性を多くの面で置き換えています

AIフロンティアシリーズ：人材

私が初めて参加した「多業種のブレストセッション」から約3年が経ち、かつて野心的だと考えられていた機械学習の概念が、今では人事部門でも実現可能になっていることに驚かされています...

フロントエンド開発のトレンド

最先端の進歩や最高水準のイノベーションが、現在ウェブ開発の世界を形作っている様子について、私たちと一緒に深く掘り下げてみませんか

ChatGPTのようなChatBot Zhinaoは、何を言うべきか、何を言うべきでないかを知っています

生成型人工知能（AI）はテック界隈で中心的な役割を果たしていますが、綿密に制御されたインターネット環境での運用はほとんど秘密に包まれています。しかし、中国のテック企業である360 Security Technologyは、最近、ChatGPTのようなサービスである「智脳」が中国の厳格な検閲制度をどのように航行しているかについて明らかにしました。この解明について掘り下げ、生成型AIが検閲に適応する方法を探ってみましょう。また読む：中国の提案されたAI規制が業界を揺るがす智脳を紹介：中国の「知的脳」ChatGPTのようなテクノロジー北京での盛大なセレモニーで、360 Security Technologyは、革新的なAIチャットボットである「智脳」、または「知的脳」としても知られる、を紹介しました。創業者であり会長の周鴻祎氏は、このテクノロジーのキーとなる側面を明らかにし、埋め込まれた「多段階のフィルタリングとモデレーション」システムを強調しました。このシステムは、中国の厳格な検閲規制の遵守に不可欠です。即時停止：精度を持って機微な言葉を扱う智脳の目立つ特徴の1つは、ユーザーが「機微な言葉」を入力した場合、すぐに会話を停止できる能力です。同社は、禁止された単語やフレーズの包括的なリストを編集し、人間のモデレーターの努力と公安部の監視によって継続的に更新しています。この厳格な制御メカニズムは、生成型AIが中国の検閲システムの要求に適応する方法を示しています。また読む：招待制アクセス：コンテンツセキュリティの強化 360 Security Technologyは、招待コードを通じてそのチャットボットへのアクセスを提供する中国のテック大手企業の一般的な制限ポリシーに従っています。この方法を採用することで、同社は、誰が自社の生成型AI製品を利用するかをより制御することができます。コンテンツセキュリティは、オンラインコンテンツの厳格な監視を維持することに中国がコミットしていることと一致しています。また読む：中国が人工知能のリスクに警鐘を鳴らす地方法律と倫理の航行周鴻祎氏は、大規模な言語モデルと生成型AIの開発において、地方の法律、規制、倫理、伝統に従うことの重要性を強調しました。彼は、これらの要因との遵守は、このような技術が開発された国に関係なく、重要であると強調しました。周氏の発言は、AIの出力を地元の規範や価値観に合わせることの重要性を強調しています。また読む：米国議会が動き出した：人工知能の規制を提案する2つの新しい法案中国の規制環境：制御された生成型AIに向けた一歩中国のサイバースペース管理局（CAC）は、4月に、生成型AIを統治する草案規則を導入しました。これらの規制は、各AI製品のセキュリティアセスメントを公開前に義務付け、チャットボットが政権転覆、暴力、ポルノグラフィ、または経済・社会秩序を乱すコンテンツを生成することを禁止しています。正式には導入されていませんが、これらの規則は、中国がその国境内でAI技術の開発と展開を形作ろうとする努力を示しています。また読む：EUはAIルールで立場を取る戦略的回避：機微な質問を回避する BaiduのErnie…

中国の研究者グループが開発したWebGLM：汎用言語モデル（GLM）に基づくWeb強化型質問応答システム

大規模言語モデル（LLM）には、GPT-3、PaLM、OPT、BLOOM、GLM-130Bなどが含まれます。これらのモデルは、言語に関してコンピュータが理解し、生成できる可能性の限界を大きく押し上げています。最も基本的な言語アプリケーションの一つである質問応答も、最近のLLMの突破によって大幅に改善されています。既存の研究によると、LLMのクローズドブックQAおよびコンテキストに基づくQAのパフォーマンスは、教師ありモデルのものと同等であり、LLMの記憶容量に対する理解に貢献しています。しかし、LLMにも有限な容量があり、膨大な特別な知識が必要な問題に直面すると、人間の期待には及びません。したがって、最近の試みでは、検索やオンライン検索を含む外部知識を備えたLLMの構築に集中しています。たとえば、WebGPTはオンラインブラウジング、複雑な問い合わせに対する長い回答、同等に役立つ参照を行うことができます。人気があるにもかかわらず、元のWebGPTアプローチはまだ広く採用されていません。まず、多数の専門家レベルのブラウジング軌跡の注釈、よく書かれた回答、および回答の優先順位のラベリングに依存しており、これらは高価なリソース、多くの時間、および広範なトレーニングが必要です。第二に、システムにウェブブラウザとのやり取り、操作指示（「検索」、「読む」、「引用」など）を与え、オンラインソースから関連する材料を収集させる行動クローニングアプローチ（すなわち、模倣学習）は、基本的なモデルであるGPT-3が人間の専門家に似ている必要があります。最後に、ウェブサーフィンのマルチターン構造は、ユーザーエクスペリエンスに対して過度に遅いことがあり、WebGPT-13Bでは、500トークンのクエリに対して31秒かかります。本研究の清華大学、北京航空航天大学、Zhipu.AIの研究者たちは、10億パラメータのジェネラル言語モデル（GLM-10B）に基づく、高品質なウェブエンハンスド品質保証システムであるWebGLMを紹介します。図1は、その一例を示しています。このシステムは、効果的で、手頃な価格で、人間の嗜好に敏感であり、最も重要なことに、WebGPTと同等の品質を備えています。システムは、LLM-拡張検索器を含む、いくつかの新しいアプローチや設計を使用して、良好なパフォーマンスを実現しています。精製されたリトリーバーと粗い粒度のウェブ検索を組み合わせた2段階のリトリーバーである。 GPT-3のようなLLMの能力は、適切な参照を自発的に受け入れることです。これは、小型の密集リトリーバーを改良するために洗練される可能性があります。引用に基づく適切なフィルタリングを使用して高品質のデータを提供することで、LLMはWebGPTのように高価な人間の専門家に頼る必要がありません。オンラインQAフォーラムからのユーザーチャムアップシグナルを用いて教えられたスコアラーは、さまざまな回答に対する人間の多数派の嗜好を理解することができます。図1は、WebGLMがオンラインリソースへのリンクを含むサンプルクエリに対する回答のスナップショットを示しています。彼らは、適切なデータセットアーキテクチャがWebGPTの専門家ラベリングに比べて高品質のスコアラーを生成できることを示しています。彼らの定量的な欠損テストと詳細な人間評価の結果は、WebGLMシステムがどれだけ効率的かつ効果的かを示しています。特に、WebGLM（10B）は、彼らのチューリングテストでWebGPT（175B）を上回り、同じサイズのWebGPT（13B）よりも優れています。Perplexity.aiの唯一の公開可能なシステムを改善するWebGLMは、この投稿時点で最高の公開可能なウェブエンハンスドQAシステムの一つです。結論として、著者らは次のことを提供しています。・人間の嗜好に基づく、効果的なウェブエンハンスド品質保証システムであるWebGLMを構築しました。WebGPT（175B）と同等のパフォーマンスを発揮し、同じサイズのWebGPT（13B）よりもはるかに優れています。 WebGPTは、LLMsと検索エンジンによって動力を与えられた人気システムであるPerplexity.aiをも凌駕します。•彼らは、WebGLMの現実世界での展開における制限を特定しています。彼らは、ベースラインシステムよりも効率的でコスト効果の高い利点を実現しながら、高い精度を持つWebGLMを可能にするための新しい設計と戦略を提案しています。•彼らは、Web強化QAシステムを評価するための人間の評価メトリックを定式化しています。広範な人間の評価と実験により、WebGLMの強力な能力が示され、システムの将来的な開発についての洞察が生成されました。コードの実装はGitHubで利用可能です。

宇宙における私たちの位置を理解する

マーティン・ルーサー・キングJr.奨学生であるブライアン・ノードは、機械を訓練して宇宙を探索し、研究における公正を求めて戦っています

ドローンは、液体ニューラルネットワークを使用して未知の環境をナビゲートします

MITの研究者たちは、脳に着想を得た液体ニューラルネットワークを使用して、自律ドローンのナビゲーションにおける新しい進歩を展示しましたこれにより、分布外のシナリオでも優れた性能を発揮しています

Learn more about Search Results EU - Page 164