Search Results A

Airbnbの研究者がChrononを開発：機械学習モデルの本番用機能を開発するためのフレームワーク

機械学習の絶え間なく進化する風景において、特徴管理はAirbnbのMLエンジニアにとって重要な課題となっています。彼らはさまざまな製品のための革新的なモデルを作成することを目指していますが、モデルにすべての焦点を当てる代わりに、インフラの複雑さに時間を費やすことがしばしばあります。Airbnbは、特徴データの管理を効率化し、リアルタイムの更新を提供し、トレーニングと本番環境の整合性を確保する解決策の必要性を認識しました。そこで登場するのがChrononです。Airbnbチームによって設計された強力なAPIで、これらの課題に対処することを目指しています。Chrononは、MLプラクティショナーが特徴を定義し、モデルのトレーニングと本番推論のためのデータ計算を一元化することを可能にし、プロセス全体での正確性と一貫性を保証します。さまざまなソースからのデータの取り込み Chrononは、イベントストリーム、データウェアハウスの事実/寸法テーブル、テーブルのスナップショット、変更データストリームなど、さまざまなソースからデータを取り込むことができます。リアルタイムのイベントデータや履歴のスナップショットなど、Chrononはすべてのデータをシームレスに処理します。柔軟性を持ってデータを変換する ChrononのSQLのような変換と時間ベースの集計により、MLプラクティショナーは簡単にデータを処理することができます。標準の集計や高度なウィンドウ処理技術など、ChrononのPython APIは、複雑な計算を実行する能力をユーザーに与えながら、完全な柔軟性と組み合わせ性を保証します。オンラインおよびオフラインの結果生成 Chrononは、オンラインおよびオフラインのデータ生成の要件の両方に対応しています。Chrononは、特徴データを提供する低レイテンシのエンドポイントやトレーニングデータのためのHiveテーブルなど、さまざまなユースケースに適した「Accuracy」パラメータを提供します。これにより、リアルタイムの更新からデイリーのリフレッシュまで、幅広い用途に対応できます。正確性とデータソースの理解 Chrononの正確性へのユニークなアプローチにより、派生データの望ましい更新頻度を表現することができます。ほぼリアルタイムまたはデイリーの間隔であるかどうかに関係なく、Chrononの「Temporal」または「Snapshot」の正確性モデルは、各ユースケースの特定の要件に合わせて計算が整合することを保証します。データソースはChrononエコシステムの重要なコンポーネントです。Chrononは、次の3つの主要なデータ取り込みパターンをサポートしています：タイムスタンプ付きアクティビティのためのイベントデータソースビジネスエンティティに関連する属性メタデータのためのエンティティデータソース遅変化次元での履歴的な変更を追跡するための累積イベントソース計算コンテキストとタイプ Chrononは、オンラインとオフラインの2つの異なるコンテキストで動作します。オンラインの計算は低レイテンシのアプリケーションに提供され、オフラインの計算はバッチジョブを使用してデータウェアハウスのデータセットで実行されます。すべてのChrononの定義は、集計のためのGroupBy、さまざまなGroupBy計算からのデータの組み合わせのためのJoin、およびカスタムのSpark SQL計算のためのStagingQueryの3つのカテゴリに分類されます。強力な洞察を得るための集計の理解 ChrononのGroupBy集計は、従来のSQLのgroup-by機能にさまざまな拡張機能を提供します。ユーザーは、時間に基づいた集計のためのウィンドウ、追加の粒度のバケット、および配列内のネストデータを処理するための自動展開を活用することができます。さらに、時間ベースの集計は、MLモデルのための洞察に富んだ特徴を作成するためのさらなる柔軟性を提供します。 AirbnbのMLプラクティショナーにとってのシームレスな統合 Chrononは、AirbnbのMLプラクティショナーにとって画期的な変革をもたらしました。Chrononは、特徴エンジニアリングを簡素化することで、MLモデルのパワーを引き出すために数千もの特徴を生成することができるようにユーザーに提供します。この革命的なソリューションにより、MLエンジニアは手動のパイプラインの実装の負担から解放され、常に変化するユーザーの行動と製品の需要に対応する革新的なモデルの構築に集中することができます。まとめると、ChrononはAirbnbの機械学習の武器庫に欠かせないツールとなりました。包括的な特徴管理ソリューションを提供することで、特徴エンジニアリングの生産性と拡張性を引き上げ、MLプラクティショナーによる最先端のモデルの提供と数百万人のユーザーのAirbnb体験の向上を実現しています。

NVIDIAとテルアビブ大学の研究者が、効率的な訓練時間を持つコンパクトな100 KBのニューラルネットワーク「Perfusion」を紹介しました

テキストから画像への変換（T2I）モデルは、自然言語の入力を通じて創造プロセスを指示する力をユーザーに与えることで、技術的な柔軟性の新たな時代を迎えました。しかし、これらのモデルをユーザーが提供する視覚的な概念と正確に一致させることは困難とされています。T2Iの個別化には、高い視覚的な忠実度と創造的な制御のバランスを取ること、単一の画像内で複数の個別化されたアイデアを効果的に組み合わせること、モデルのサイズを効率的な性能のために最適化することなど、困難な課題が含まれています。これらの課題に対応するために、「パファージョン」と呼ばれる画期的な個別化手法が開発されました。パファージョンの本質は、基礎となるT2Iモデルに対して動的なランク1の更新を適用する能力にあります。この革新により、モデルは高い視覚的な忠実度を維持しながら、生成される画像に対してユーザーの創造的な影響力を行使することが可能となります。パファージョンが対処する最も重要な課題の1つは、過適合の防止です。この点において、「キーロック」として知られる新しいメカニズムが導入されています。このメカニズムは、新しい概念の相互注意キーをその上位カテゴリにアンカーし、過適合のリスクを軽減し、モデルの堅牢性を向上させます。さらに、パファージョンは、学習した概念の影響を推論中に正確に制御するためのゲート付きランク1アプローチを活用しています。この強力な機能により、複数の個別化された画像を組み合わせることが可能となり、ユーザーの入力を反映した多様で想像力豊かな視覚的な出力が促進されます。パファージョンの最も注目すべき属性の1つは、視覚的な忠実度とテキストの整合性を調和させながら、コンパクトなままであるという点です。パファージョンがその魔法を行うために必要なのは、100KBの訓練済みモデルだけです。これは、現在の最先端のモデルよりも5桁小さいという点を考慮すると、さらに印象的な偉業です。パファージョンの効率は、そのコンパクトなサイズを超えています。このモデルは、追加のトレーニングを必要とせずに、Paretoフロント全体にわたるさまざまな動作点を容易にカバーすることができます。この適応性により、ユーザーは望む出力を細かく調整することができ、T2Iの個別化プロセスの全ポテンシャルを引き出すことができます。パファージョンは、実証評価において強力なベースラインに対して優越性を示しており、質的および定量的な評価において印象的な結果を誇っています。そのキーロックメカニズムは、従来のアプローチと比較して新しい成果を達成するために重要な役割を果たしており、従来には考えられなかった個別化されたオブジェクトの相互作用の描写を可能にしています。パファージョンは、ワンショットの設定でも驚くべき視覚的な構図を生成する能力を示しています。技術の世界が進化し続ける中で、パファージョンは自然言語処理と画像生成の交差点での素晴らしい可能性の証となっています。 T2Iの個別化における革新的なアプローチにより、パファージョンは創造性と表現の新たな道を開き、人間の入力と高度なアルゴリズムが調和して共存する未来の一端を垣間見せています。

「タンパク質設計の革命：ディープラーニングの改良により成功率が10倍に向上したこのAI研究」

タンパク質はほぼすべての疾患を統治するポリマー構造です。主な問題は、どのタンパク質がそれに対応するタンパク質ポリマー構造と結合できるかを見つけることです。主な負荷は、大量の分子から結合できる分子を見つけることです。これには、機械学習とディープラーニングモデルの使用が必要です。研究科学者のチームは、以前に得られた分子と比較して10倍のサイズの分子を予測するためにディープラーニングの技術を使用しました。研究科学者たちは、ディープラーニングモデルを通じて親水性結合の強さの品質についても引き続き取り組んでいます。ディープラーニングアルゴリズムは、前述のように、生データを使用して高品質の特徴と情報を抽出します。タンパク質配列の変換を研究するために、ディープラーニングの技術を介した反復的な手法が使用されました。予測または生成された構造は、ほぼ1に近い精度を持つことが判明しました。これらの反復的な手法は、正確に予測されたモデルに収束するために使用されました。研究チームはタンパク質設計のために2つのソフトウェアツールを開発しました。ベクトルの形で独立した情報があるため、すべてのタンパク質設計は互いに独立していることも判明しました。問題は、膨大な計算装置で一斉に実行される何百万ものデザインに分割されます。ワシントン大学シアトル校、ハワード・ヒューズ医学研究所、タンパク質設計研究所の研究チームは、得られたタンパク質分子を小さなエンティティの塊に分割しました。それから、それぞれの塊をLinuxの施設を使用してフロンテラのコンピュートノードに割り当てます。これらの小さなタンパク質エンティティはさらに小さなエンティティに分割されます。これらは計算設計ソフトウェアに渡されます。さらにタンパク質ソフトウェアに渡され、計算効率が増加します。これにより、効率は以前に記録された約200倍になります。この結果は、ターゲットタンパク質に対する結合の学習速度が10倍に増加していることを示しています。研究者たちは多大な努力を払っていますが、この経路はまだ長い道のりがあります。この研究のさらなる計画は、タンパク質分子により良いターゲットを提供し、タンパク質分子の成功率や精度を高めることです。このプロジェクトはまた、明日のがん治療ツールの開発を目指しています。

このAI論文では、これらの課題に対処しながらMoEsの利点を維持するために、完全に微分可能な疎なTransformerであるSoft MoEを提案しています

大きなTransformerが適切に機能するには、より多くの計算コストが必要です。最近の研究では、モデルのサイズとトレーニングデータは同時にスケーリングする必要があり、トレーニングの計算リソースを最大限に活用するために必要です。モデルの拡張性を可能にする代替手法として、専門家のスパースミックスが考えられています。言語、ビジョン、およびマルチモーダルモデルでは、ネットワーク全体でトークンパスウェイをスパースに活性化するための手法が最近開発されています。スパースMoE Transformerの中心にあるのは、各入力トークンに適用するモジュールを選択することであり、これは離散最適化の課題です。これらのモジュールはしばしばMLP（多層パーセプトロン）であり、専門家と呼ばれています。適切なトークンと専門家のペアリングを特定するためには、線形プログラム、強化学習、決定論的な固定ルール、最適輸送、トークンごとの上位kの専門家、および専門家ごとの上位kのトークンなど、さまざまな手法が使用されます。専門家の利用率をバランスさせ、未割り当てのトークンを減らすためには、ヒューリスティックな補助的な損失がしばしば必要です。小さな推論バッチサイズ、一意の入力、または転移学習は、これらの問題を分布外設定で悪化させることがあります。Google DeepMindの研究者は、これらの問題のいくつかに対処する新しい戦略であるSoft MoEを提供しています。 Soft MoEは、トークンと専門家の間の良いハードな割り当てを求めるスパースで離散的なルーターではなく、トークンを組み合わせることによってソフトな割り当てを行います。彼らは特に、トークンと専門家の両方に依存するいくつかの重み付き平均を構築し、それぞれの重み付き平均を関連する専門家で処理します。スパースMoEの中心にある離散プロセスによって引き起こされる上記の多くの問題は、ソフトMoEモデルでは存在しません。一般的なスパースMoE手法では、望ましい挙動を課す補助的な損失があり、これらの補助的な損失はルーティングスコアに依存します。ルーターパラメータは、専門家の出力を選択されたルーティングスコアと後置乗算することで学習されます。観察によると、これらのアルゴリズムはしばしばランダムな固定ルーティングと同様のパフォーマンスを発揮します。Soft MoEは、各入力トークンに依存して各ルーティングパラメータを直接更新することにより、この問題を回避します。彼らは、巨大な割合の入力トークンがネットワーク内で同時に離散的なパスを変更できることに気付き、トレーニング中にトレーニングの問題を引き起こすと述べています。ソフトルーティングは、ルーターのトレーニング時に安定性を提供することができます。多くの専門家が存在する場合、ハードルーティングも困難です。ほとんどの作品は少数の専門家でのみ訓練されるためです。彼らはSoft MoEが数千の専門家にスケーラブルでバランスの取れたモデルであることを示しています。最後に、推論中にバッチ効果はありません。つまり、1つの入力が複数の入力のルーティングと予測に影響を与えることはありません。訓練には約半分の時間しかかからず、Soft MoE L/16はViT H/14を上流、フューショット、およびファインチューニングで上回り、推論でも速くなります。また、同等のトレーニング量の後、Soft MoE B/16はViT H/14よりも上流の指標で勝ち、フューショットとファインチューニングではViT H/14と同等のパフォーマンスを発揮します。Soft MoE B/16はViT H/14のパラメータの5.5倍を持っていながら、推論は5.7倍速くなります。

「インドが最新のAIを活用してペイメント詐欺に取り組む方法」

今日のデジタル時代において、オンライン取引に関連する詐欺は増加しており、金融機関と規制当局に重大な課題をもたらしています。インドのユニーク・アイデンティフィケーション・オーソリティ（UIDAI）は、アドハール有効決済システム（AePS）に関連する特に支払い詐欺に対処するため、積極的なアプローチを取っています。人工知能（AI）と機械学習（ML）の力を活用して、UIDAIは指紋認識と顔認識を中心とした革新的な技術を開発しています。これらのAI対策がどのように支払い詐欺の抑制とお金の安全を確保するのに役立っているかについて探ってみましょう。また、AIによる「ディープフェイク」詐欺：ケララ州の詐欺師に対する継続的な戦いも参照してください。 AIによる指紋の最小情報記録 – 指紋画像記録（FMR-FIR）モダリティ UIDAIは、アドハール認証中の複製指紋の使用に対抗するために、社内でAI/ML技術をベースにしたFMR-FIRモダリティを導入しました。この洗練されたシステムは、本物または「ライブ」の指紋と複製の指紋を区別し、AePS取引の追加のセキュリティ層を提供します。認証中に指紋の生存性をチェックすることで、このAI駆動のソリューションは、詐欺師が指紋データを不正に利用して銀行口座にアクセスすることを大幅に減少させました。また、AI時代のディープフェイクの検出と処理方法も参照してください。取引認証における顔認識の役割インド国立支払い公社（NPCI）と連携し、Airtel Payments BankはUIDAIと協力して、AePS取引のための顔認識に基づいた認証手法を導入しました。UIDAIが社内で開発したこの最先端の顔認識技術は、デジタル取引のセキュリティをさらに向上させます。顔の特徴を通じてユーザーの身元を確認し、本物の個人のみが金融取引を行えるようにし、システムを悪用しようとする詐欺師を効果的に防止します。支払い詐欺の増加傾向インドの支払い詐欺の規模は、内務省と財務委員会の報告によれば、深刻な増加を示しています。2020-21年の財務年度には、様々な金融犯罪の報告件数が262万件報告されましたが、2022年には驚異的な694万件にまで増加しました。そのうち支払い関連の詐欺は急激に増加し、23財務年度には約2000万件に達しました。これらの統計は、デジタル取引を保護し、ユーザーを潜在的なサイバー犯罪から守るために、頑健なAIベースのソリューションの緊急性を強調しています。また、AI駆動のサイバー犯罪ツール「FraudGPT」の驚異的な増加も参照してください。ビジネスコレスポンデントの課題 AIベースの技術は、特定の種類の詐欺防止において効果を発揮していますが、制限もあります。1つの重要な課題は、ビジネスコレスポンデント（BC）による詐欺の対処です。これらはバイオメトリックPOS（販売時点）機器を備えた非公式な銀行代理店であり、マイクロATMとして機能しています。一部の場合、BCは個人に支払われる金額を誤って報告し、彼らを金融的な搾取の危険にさらします。特に農村地域では、認識の欠如が状況を悪化させ、ユーザーに安全な銀行取引の実践について教育することが重要となります。また、ワームGPTを利用したメールセキュリティの侵害も参照してください。 UIDAIのAePS詐欺への取り組み UIDAIは、常にAIベースのソリューションを洗練させることで詐欺師に先手を打ち続けています。同機関は、2021年11月から2023年3月までに2,000件以上のAePS取引に関連する苦情を受け付けています。UIDAIは、銀行、政府機関、および他の関係者と協力して、デジタル支払いシステムのセキュリティを強化し、インド全体の数百万人のユーザーの信頼を維持することを目指しています。また、詐欺メールを特定するためのAIツールの開発も参照してください。私たちの見解急速にデジタル化が進む世界において、デジタル取引を保護する重要性は言い尽くせません。UIDAIが支払い詐欺を防ぐためにAIとMLの技術を採用することは、数百万人のインド人の金融利益を確保する上で重要な一歩です。FMR-FIRモダリティや顔認識などの革新的な手法を通じて、UIDAIはより安全で信頼性の高いデジタル支払いエコシステムを構築しています。デジタルの複雑さを乗り越えるにあたり、これらの進歩を受け入れ、サイバー犯罪者の手から自分自身と自分の築き上げたお金を守るために協力しましょう。私たちの共同の努力により、より安全で信頼性の高いデジタルの未来を築くことができます。

「Jupyter AIに会おう Jupyterノートブックで人工知能の力を解き放つ」

人工知能（AI）とコーディングの革新的な進歩において、Project Jupyterはそのツールキットに画期的な追加を導入します。それがJupyter AIです。このエキサイティングな事業は、Jupyterノートブックの世界に生成型AIを導入し、コーディング体験を革新するという素晴らしい機能を提供します。マジックコマンドと洗練されたチャットインターフェースの統合により、Jupyter AIはコードとの対話方法を再定義します。さらに、エラーのトラブルシューティングやノートブック全体の作成さえも行うことができます。Jupyter AIの世界に飛び込み、その多様な機能を探索してみましょう。それは経験豊富な開発者と好奇心旺盛な学習者の両方を魅了するでしょう。また読む：AnthropicがClaude 2を公開：コーディングを革新する次世代AIチャットプログラム Jupyter AI：AIとコーディングのギャップを埋める Jupyter AIは、インタラクティブな計算とデータ分析を支援する役割で有名なプラットフォームであるProject Jupyterの公式サブプロジェクトです。生成型人工知能の導入により、Jupyter AIは自然言語のプロンプトからコードを理解し、生成し、合成する機能を提供します。このAIの能力とコーディングの創造性の融合は、効率的なワークフローを実現し、学習を加速する可能性を広げます。また読む：Codey：Googleのコーディングタスク用生成AI 選択によるエンパワーメント：責任あるAIのアプローチ Jupyter AIの特徴の1つは、責任あるAIとデータプライバシーへの取り組みです。このプラットフォームでは、ユーザーが自分の好みの大規模言語モデル（LLM）、埋め込みモデル、およびベクトルデータベースを選択し、AIの動作を独自の要件に合わせることができます。このカスタマイズにより、体験を個人化するだけでなく、透明性とプライバシーを重視するフレームワークが確立されます。Jupyter AIの基本的なプロンプト、チェーン、およびコンポーネントはオープンソースであり、ユーザーはAIの動作を詳細に検証して理解することができます。さらに、Jupyter AIはモデル生成コンテンツに関連するメタデータを保存し、コーディングワークフロー内でAIによって生成されたコードを追跡するための組み込みメカニズムを提供します。また読む：MetaがCodeComposeをリリース- GitHub CopilotのAIパワード代替ツールプライバシーの確保：倫理的なAIの核データプライバシーの懸念が高まる時代に、Jupyter…

Learn more about Search Results A - Page 310

Airbnbの研究者がChrononを開発：機械学習モデルの本番用機能を開発するためのフレームワーク

NVIDIAとテルアビブ大学の研究者が、効率的な訓練時間を持つコンパクトな100 KBのニューラルネットワーク「Perfusion」を紹介しました

「タンパク質設計の革命：ディープラーニングの改良により成功率が10倍に向上したこのAI研究」

このAI論文では、これらの課題に対処しながらMoEsの利点を維持するために、完全に微分可能な疎なTransformerであるSoft MoEを提案しています

「インドが最新のAIを活用してペイメント詐欺に取り組む方法」

「Jupyter AIに会おう Jupyterノートブックで人工知能の力を解き放つ」

「AIとオペレーション管理 – 天国での真のマッチング？」

「PEARLと出会ってください – 顧客サポートと販売の電話を実行できる新しいAIツール」

「PCAを基礎から構築する」

「Javaプログラミングの未来：2023年に注目すべき5つのトレンド」

Find the right Blockchain Investment for you