Learn more about Search Results A - Page 240

「Pandasによるデータクリーニング」

このステップバイステップのチュートリアルは、初心者向けであり、強力なPandasライブラリを使用してデータのクリーニングと前処理のプロセスをガイドします

このAIの論文では、プログラミング言語が指示調整を通じて互いを向上させる方法について説明しています

大型言語モデル(LLM)の導入は世界中で大きな話題となっています。これらのモデルは、人間のように独自で創造的なコンテンツを生成し、人間のように質問に答えることで知られています。また、これらのモデルは長い文章を要約したり、言語を翻訳したり、コードを補完することも可能です。最近、コード生成専用のLLMが急速に開発されています。これらのモデルの素晴らしいコード生成能力は、学術および産業界で大きな注目を集めています。CodeGeeX、StarCoder、CodeLlama、Codexなどは、最近導入された注目すべきコードLLMの一部です。 指示チューニングアルゴリズムの応用は、コードLLMの分野での興味深いブレークスルーです。最近の研究では、特定の指示に従う方法をLLMに教えることで、彼らのコード生成能力を向上させることが可能であるというアイデアが検討されています。最近の研究では、人間のプログラマが1つのプログラミング言語をマスターした後、2番目の言語を習得することがより簡単になる可能性があるという興味深いアイデアを探求しています。この研究の主な目標は、大型言語モデルが指示を微調整している間に、さまざまなプログラミング言語がお互いを補完できるかどうかを明らかにすることです。 この理論を探求し、調査するために、研究者のグループはPython、JavaScript、TypeScript、C、C++、Java、Go、HTMLの8つの人気プログラミング言語を使用した一連の大規模な実験を行いました。これらの言語は、HTMLのようなマークアップ言語からCやC++のようなシステムレベルの言語、PythonやJavaScriptのようなスクリプト言語まで、さまざまなプログラミングパラダイムとユースケースを含んでいます。これらのテストの主な目的は、1つのプログラミング言語での指示の微調整が他の言語と組み合わせた場合に、コードLLMのパフォーマンスを向上させるかどうかを確認することでした。これらのテストでは、使用されるコードLLMはStarCoderでした。 言語ごとの構文や要件に指示が準拠していることを確認するために、言語固有の指示を作成する方法は、初期のPythonベースのシード指示を詳細に進化させるか、HTMLの場合は広範な進化を行うことです。詳細な進化は、Pythonベースのシード指示から始めて、より複雑でターゲットの言語に合わせた言語固有の指示を生成する方法であり、言語固有のニュアンスを捉えます。一方、広範な進化は、Pythonベースの指示からではなく、HTML固有の指示を新たに作成する方法であり、Web開発のHTMLの独特な性質を認識しています。 実験の結果からは、いくつかの強力な結論が導かれました。コード作成の作業において、プログラミング言語は明らかに他の言語よりも優れたパフォーマンスを発揮することが示されました。例えば、HumanEval-Xベンチマークを使用してJavaコードでテストした場合、PythonデータでトレーニングされたCODEM-Python 15Bというコードモデルは、pass@1の正解率において驚異的な17.95%の絶対的な改善を示しました。この結果から、Pythonのような1つの言語の知識は、Javaなどの他の言語でのコード生成を大幅に改善することができるということが示唆されます。 さらに驚くべきことに、マークアップ言語であるHTMLのコーパスに使用された場合、CODEM-HTML 7Bはpass@1の絶対的な改善率15.24%を示しました。これは、HTMLのようなマークアップ言語とJavaのような従来のプログラミング言語など、根本的に異なる言語でも、お互いのコード生成能力を相互に向上させることができるということを意味します。

マイクロソフトリサーチがAIコンパイラの「ヘビーメタルカルテット」である「Rammer」「Roller」「Welder」「Grinder」をリリースしました

人工知能(AI)モデルとハードウェアアクセラレータの進化により、コンパイラには独自の課題が生じています。これらの課題は、AIモデルの絶えず変化するアーキテクチャから生じており、RNNやCNNから最近のTransformerなどのモデルへの移行、さらにはGPUやNPUなどのハードウェアアクセラレータの急速な進歩といったものです。その結果、効率的なコンパイルは、これらの新しいAIモデルが現代のハードウェア上で効果的に実行されることを保証するために重要となっています。 従来のAIコンパイラは、通常、深層ニューラルネットワーク(DNN)の実行を最適化する際に制約がありました。現在のコンパイラは、DNNの計算を不透明なライブラリ関数を持つデータフローグラフとして扱い、2段階のスケジューリングによる大幅なオーバーヘッドとハードウェアリソースの未使用を引き起こしています。さらに、AIモデルのデータのパーティショニングとメモリアクセスの最適化は、時間がかかる場合があります。 最後に、ほとんどのAIコンパイラは、主にデータフローの実行を最適化することに焦点を当てており、AIモデル内の制御フローコードの効率的な実行に注意を払っています。この制約は、複雑な制御ロジックを持つモデルに影響を与え、ハードウェアアクセラレーションを十分に活用する能力を妨げます。 Microsoft Researchの研究者グループは、AIコンパイルの特定の側面に対応するために設計された画期的なAIコンパイラのセット「ヘビーメタル・カルテット」を紹介しました。このカルテットには、Rammer、Roller、Welder、Grinderの4つのコンパイラが含まれています。 Rammer: Rammerは、AIコンパイルのスケジューリングスペースを二次元平面として再設計し、大規模な並列アクセラレータユニット上でのDNNワークロードの実行を最適化します。Rammerは、この平面上の計算タスクを「ブリック」として配置することで、実行時のスケジューリングオーバーヘッドを最小限に抑え、ハードウェアの利用効率を大幅に向上させます。 Roller: Rollerは、データブロックのパーティショニング戦略を効率的に定式化することで、コンパイルの効率を最適化します。既存のコンパイラと比較して、高度に最適化されたカーネルを数秒で生成し、コンパイル時間を3桁改善します。 Welder: Welderは、DNNモデルのメモリアクセス効率を包括的に最適化し、メモリ帯域幅と計算コアの利用率のギャップを縮小します。さまざまなDNNモデルとコンパイラで顕著なパフォーマンス向上を実現します。 Grinder: Grinderは、AIモデル内の制御フローの実行を最適化し、データフローに制御フローを効率的に統合することで、ハードウェアアクセラレータ上での効率的な実行を実現します。制御フロー集中型のDNNモデルに対して8.2倍の高速化を実現し、制御フローに対するDNNコンパイラの中で最速の性能を発揮します。 カルテットのパフォーマンスは、複数のデバイスとAIモデルで評価されました。Rammerは最先端のコンパイラを凌駕し、GPUで最大20.1倍の高速化を実現しました。Rollerは、競争力のあるパフォーマンスを維持しながら、コンパイル時間を3桁改善しました。Welderは、より高速な計算コアを持つハードウェアで、既存のフレームワークやコンパイラを最大21.4倍凌駕しました。Grinderは、制御フロー集中型のDNNモデルに対して8.2倍の高速化を実現し、制御フローに対するDNNコンパイラの中で最速の性能を発揮しました。 結論として、AIモデルとハードウェアが進化し続ける中で、効率的な実行を保証するためのコンパイラの役割はますます重要になっています。このカルテットの貢献は、画像認識からNLPまでさまざまなアプリケーションでより効果的なAI展開の道を開き、結果としてデジタル世界におけるAI技術の能力を向上させるものです。

メタAIがNougatをリリース:科学文書を処理するためのOCRを実行するビジュアルトランスフォーマーモデルで、マークアップ言語に変換します

人工知能の発展とともに、そのサブフィールドである自然言語処理、自然言語生成、コンピュータビジョンなどは、広範なユースケースにより急速に人気を集めています。光学文字認識(OCR)は、コンピュータビジョンの確立された研究領域であり、積極的に研究が行われています。ドキュメントのデジタル化、手書き文字認識、シーンテキスト識別など、多くの用途があります。数式の認識は、OCRの中でも特に学術研究で大いに関心を集めている領域です。 ポータブルドキュメントフォーマット(PDF)は、科学知識の最も広く使用される形式の1つであり、通常は書籍に保存されるか、学術誌に掲載されます。インターネット上で2.4%の情報を占める最も使用されるデータ形式の2番目のPDFは、ドキュメント配信に頻繁に使用されます。広範な使用にもかかわらず、PDFファイルから情報を抽出することは難しい場合があります。特に、これらの論文がPDF形式に変換されると、数式の意味情報が頻繁に失われます。 これらの課題に対処するため、Meta AIの研究チームは「Neural Optical Understanding for Academic Documents」を意味する「Nougat」という解決策を提案しました。Nougatは、科学的なテキストに光学文字認識(OCR)を行うためのVisual Transformerモデルです。その目標は、これらのファイルをマークアップ言語に変換して、より簡単にアクセス可能で機械読み取り可能にすることです。 手法の効果を示すために、チームは学術論文の新しいデータセットも作成しました。この手法は、デジタル時代における科学知識のアクセシビリティを向上させるための具体的な答えを提供します。これにより、人間にとって読みやすい書面とコンピュータが処理・分析できるテキストとの間のギャップが埋まります。研究者、教育者、科学文献に興味のある人は、Nougatを使用して科学論文により効果的にアクセスし、取り扱うことができます。Nougatは、基本的にはイメージを持つドキュメントページ、特にPDFからフォーマットされたマークアップテキストに変換するためのトランスフォーマーベースのモデルです。 チームは、次のような主な貢献をまとめています。 事前学習済みモデルの公開:チームはPDFをシンプルなマークアップ言語に変換することができる事前学習済みモデルを作成しました。この事前学習済みモデルはGitHubで公開されており、研究コミュニティや誰でもアクセスできるようになっています。 データセット作成のためのパイプライン:PDF文書とそれに関連するソースコードをペアにするためのデータセット作成方法が研究で説明されています。このデータセットの開発方法は、Nougatモデルのテストや改善、将来の文書分析の研究や応用に役立つ可能性があります。 ページのイメージに依存:Nougatの特徴の1つは、ページのイメージのみで動作できる能力です。これにより、元のドキュメントがデジタルテキスト形式で利用できない場合でも、さまざまなソースからコンテンツを抽出する柔軟なツールとなります。スキャンされた論文や書籍を処理することができます。

「AIプログラムがイスラエルの男性の命を救う」

「ナハリヤのガリラヤ医療センターの患者は、AIが頭蓋内出血の警告をしたおかげで命を救われましたイスラエル・ハヨムによれば、この都市の住人である50歳の男性は定期的なCTスキャンのために診察にやってきましたスキャンの理由は...」

「データ分析と可視化のための生成型AIの利用」

信じるか信じないか、生成AIは単なるボックス内のテキスト以上です真実は、それが従来の創造的アプリケーションの境界を超えているということですだから、それがすることは、テキスト生成をはるかに超えたユーザーの能力を拡張するということですそれは芸術ですその素晴らしさに加えて...

「NVIDIAのCEOがインドの首相ナレンドラ・モディと会談」

インドの首相ナレンドラ・モディは、グローバルテクノロジースーパーパワーであるNVIDIAとの関係の深化を強調し、月曜日の夜にNVIDIAの創設者兼CEOであるジェンソン・ファンと会談しました。 ニューデリーの公式な首相の居住地である7ロク・カリャン・マルグでの会談は、モディが今週後半には米国のジョー・バイデン大統領を含むG20の首脳会議を主催する準備をしているという状況で行われました。 モディはソーシャルメディアで「NVIDIAのCEOであるジェンソン・ファン氏との素晴らしい会議をしました。インドが人工知能の世界で持つ豊かな可能性について詳しく話し合いました」と述べました。 このイベントは、モディとファンの2回目の会合であり、NVIDIAがインドの急成長するテクノロジー産業に果たす役割を強調しています。 モディとの会議は、インドが月の南極点に成功して着陸した直後に行われました。これにより、世界最大の民主主義国家の拡大する技術能力が示されました。 モディとの会議の後、ファンはインド科学研究所やインド工科大学の各キャンパスなど、科学技術の世界的な大学から数十人の研究者と非公式のディナーを開催しました。 参加者は、大規模な言語モデル、天体物理学、医学、量子コンピューティング、自然言語処理など、多岐にわたる分野のトップマインドの素晴らしい集まりを代表していました。 その夜の議論は、言語の壁を解消し、農業の収量を改善し、医療サービスのギャップを埋め、デジタル経済を変革するための技術の活用から、現代の科学の大きな課題に取り組むことまで、さまざまなトピックにわたりました。 NVIDIAはインドとの深い関係を持っています。同社は約20年前にバンガロールで事業を開始しました。現在、グルガオン、ハイデラバード、プネ、ベンガルールの4つのエンジニアリング開発センターをインドに持ち、インドには3,800人以上のNVIDIANがいます。 さらに、NVIDIAの開発者プログラムにはインドを拠点とする32万人以上の開発者がいます。NVIDIAのCUDA並列プログラミングプラットフォームは、インドでは月に約40,000回ダウンロードされ、国内には60,000人以上の経験豊富なCUDA開発者がいると推定されています。 この成長は、インド政府が国の情報技術インフラを拡大し続けているという背景があります。 たとえば、計算グリッドが国内の20の都市を繋げ、研究者や科学者がより効率的にデータと計算リソースを共有し協力するのに役立つ予定です。 その取り組みは、今後のインドの野心的な開発目標を支援することを約束しています。 モディは、インドが2030年までに世界第3位の経済大国になることを目指しています。現在は第5位です。 そして、モディは2047年、インドの独立100周年に、南アジアの国が先進国の仲間入りを果たすことを目指しています。 モディとの会議後のレセプションでの写真(左から)インド政府の主席科学顧問であるアジャイ・クマール・スード、IIScバンガロールの計算データ科学部門のチェアであるサシクマール・ガネーシャン、ファン、NVIDIA南アジア地域のマネージングディレクターであるヴィシャル・ドゥパル。

業界固有のAIのナビゲーション:移行期のヒーローから長期的なソリューションへ

人工知能(AI)の分野が進化し続ける中で、私たちは成長するトレンドを目撃しています:特定の産業に特化した大規模言語モデル(LLM)の台頭これらは…

「ChatGPTのような生成AIを使用してペルソナを作成する方法」

信じるか信じないかは別として、ChatGPTやGoogleのBardなどの生成AIチャットボットは、顧客サービス担当者や専門家などの特定のパーソナリティを持つようにトレーニングすることができますしかし、それはさらに進むことができます適切な情報と文脈をチャットボットに与えると、それが...

「オッペンハイマーからジェネラティブAIへ:今日の企業にとっての貴重な教訓」

先週末、最新の大ヒット作品「オッペンハイマー」を劇場で3時間観ましたストーリー全体と結末はすでに知っていたにも関わらず、私はまだドキドキしながら観ていました...

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us