Learn more about Search Results 19

「13/11から19/11までの週のトップ重要なLLM論文」

大規模な言語モデル(LLM)は、最近の数年間で急速に進化してきました新世代のモデルが開発されるにつれて、研究者やエンジニアが最新の進歩について情報を得ることは重要です...

「13/11から19/11までの週の最も重要なコンピュータビジョンの論文トップです」

毎週、いくつかのトップティアの学術会議やジャーナルで、画像などのさまざまな分野でのエキサイティングなブレイクスルーを提供するコンピュータビジョンの革新的な研究が紹介されました

この中国のAIモデル、Baichuan2-192kモデルはChatGPTやClaude2を超えることができるのか? 最長のコンテキストモデルを持つBaichuan Intelligentが公開した、この中国のスタートアップ「Baichuan Intelligent」のモデルに会いましょう

AIの優位性を争う中で、中国のAIスタートアップ、百川インテリジェントが最新の大容量言語モデル、百川2-192Kを発表し、長文プロンプトの処理において新たな基準を設定しました。この開発は、中国がグローバルなAIのランドスケープにおいて先駆者としての地位を確立する意気込みを示しています。 小説や法的文書、財務報告書など、大量のテキストプロンプトを扱うAIモデルへの需要が高まっています。従来のモデルは長文に苦戦することが多く、各業界でより強力で効率的な解決策が求められています。 現在、AIのランドスケープはOpenAIやMetaなどの西洋の巨大企業によって支配されており、彼らは絶えず革新的で洗練されたモデルをリリースしています。百川インテリジェントの新作、百川2-192Kは、これらの確立されたプレイヤーに挑戦します。 百川インテリジェントは、搜狗の創設者である王小川が起業した会社であり、画期的な大容量言語モデルである百川2-192Kを紹介しました。このモデルは、「コンテキストウィンドウ」という素晴らしい機能を搭載しており、一度に約35万文字の中国語の処理が可能です。比較すると、OpenAIのGPT-4-32kを14倍、AmazonがバックアップするAnthropicのClaude 2を4.4倍上回り、長文プロンプトの取り扱いに強力なツールとなっています。 百川2-192Kの主な革新点は、広範なテキストをシームレスに処理できる能力にあります。このモデルは小説の要約や品質の高い応答、長文の理解などに優れており、カリフォルニア大学バークレー校などの米国の機関が主導するプロジェクトであるLongEvalのテスト結果によって実証されています。このモデルの素晴らしいコンテキストの長さは、パフォーマンスを損なうことなく、動的な位置エンコーディングと分散トレーニングフレームワークの技術的な革新によって実現されています。百川2-192Kの優れた能力は、法律、メディア、金融などの産業において不可欠なツールとなっています。長文の処理および生成能力は、これらのセクターにおいて重要です。ただし、より多くの情報を処理できる能力が必ずしも他のモデルよりも優れているとは限らないことに留意することも重要です。これに関しては、スタンフォード大学とUCバークレーの共同研究でも指摘されています。 百川インテリジェントのAIセクターでの急速な台頭は、設立からわずか6か月でユニコーンクラブへの参加を果たすなど、中国がAI技術の可能性を広げることへの取り組みを示しています。現在、アメリカの企業がAIハードウェアとソフトウェアでリードを占めていますが、百川の積極的な戦略と技術革新は、AIの進化するランドスケープを示しています。百川2-192Kの発表は、AIの優位性を争う競争が終わりを告げたわけではなく、中国が西洋の巨大企業の支配に挑戦する意欲を示しています。百川2-192Kは、特に長文プロンプトの取り扱いにおいてAI技術の可能性の限界を押し上げる画期的なモデルです。その優れたコンテキストの長さと品質の高い応答は、さまざまな産業にとって貴重なツールとなります。

「ミリオンドルのホームサービスビジネスを始める方法(19ヶ月で130万ドルを稼ぐ)」

プールの清掃害虫駆除屋根工事これらの汚れた仕事はセクシーではないかもしれませんが、まったくもって稼げるのです

「Covid-19の感情分析」

「私はこれをするためにGoogle Collaboratoryを使用していますまず、ノートブックに以下のPythonコードを使用してPythonにkaggleをインストールします次に、kaggle.comに移動してくださいkaggle.comで、設定に移動してください...」

「咳の音を分析してCOVID-19患者の重症度を特定する」

COVID-19の重症度を評価し、呼吸器疾患の患者の長期モニタリングを可能にするために、ある研究で咳の特徴が特定されました

GoogleのAI研究者がMADLAD-400を紹介:419の言語をカバーする2.8TトークンWebドメインデータセット

自然言語処理(NLP)の常に進化する分野では、機械翻訳や言語モデルの開発は主に英語などの豊富なトレーニングデータセットの利用可能性によって推進されてきました。しかし、研究者や実践者にとって重要な課題の一つは、より一般的に話されていない言語のための多様で高品質なトレーニングデータの必要性です。この制約は、世界中のさまざまな言語コミュニティにおけるNLP技術の進展を阻害しています。この問題に着目し、独自の研究チームが解決策を創出するために立ち上がり、それがMADLAD-400の誕生に繋がりました。 MADLAD-400の重要性を理解するためには、現在の多言語NLPデータセットの状況を先に検討する必要があります。研究者は長い間、多くのソースからウェブスクレイピングされたデータを機械翻訳や言語モデルのトレーニングに利用してきました。この手法はオンラインコンテンツが豊富な言語に対しては驚異的な結果を生み出しましたが、一般的でない言語に対しては不十分です。 MADLAD-400の研究チームは、この従来の手法の制約を認識しました。彼らはウェブスクレイピングだけに頼らないことの重要性を理解していました。代わりに、419の言語で広範な手動のコンテンツ監査を行うことで、MADLAD-400の作成に取り組みました。 監査プロセスは容易なものではありませんでした。研究チームは、さまざまな言語に堪能な個人の専門知識を必要とし、言語の枠組みを超えてデータの品質を慎重に検査し評価しました。このハンズオンアプローチにより、データセットは最高品質基準を満たすことが保証されました。 研究者たちはまた、監査プロセスを詳細に文書化しました。この透明性は、データセットの利用者にとって貴重であり、データ品質を保証するために取られた手順に対する洞察を提供します。この文書は、科学研究における再現性の重要な原則を守るためのガイドと基盤となります。 手動の監査に加えて、研究チームはデータ品質をさらに向上させるためのフィルターやチェックを開発しました。著作権物、ヘイトスピーチ、個人情報などの問題のあるコンテンツを特定し対処しました。このデータクリーニングへの積極的なアプローチにより、望ましくないコンテンツがデータセットに含まれるリスクが最小限に抑えられ、研究者たちは自信を持って取り組むことができます。 さらに、MADLAD-400は、研究チームの包括的な取り組みを示すものです。これは、多様な言語を網羅し、NLP研究でしばしば代表されない言語コミュニティに声を与えるものです。MADLAD-400は、メインストリームを超えた言語を含むことにより、包括的で公正なNLP技術の開発の道を開きます。 MADLAD-400の作成とキュレーションはそれ自体で印象的な成果ですが、このデータセットの真の価値はその実用的な応用にあります。研究チームは、MADLAD-400の効果を示すために広範な実験を行いました。 その結果は明確です。MADLAD-400は、さまざまな言語にわたって翻訳の品質を大幅に向上させ、機械翻訳の分野を進化させる可能性を示しています。このデータセットは、言語の壁を超え、言語の分断を取り除き、コミュニケーションを促進するモデルのトレーニングに堅固な基盤を提供します。 総じて、MADLAD-400は、多言語自然言語処理における画期的な成果です。入念なキュレーションと包括性への取り組みにより、このデータセットは重要な課題に対応し、研究者や実践者に言語の多様性を受け入れる力を与えます。これは、言語技術がグローバルな観客に対応する未来に向けた進歩の兆しとなります。

VoAGIニュース、7月19日:ChatGPTが退位???•データサイエンティストのためのDocker •思考のツリープロンプティングによる推論

今週:ChatGPTは王座から陥落? • データサイエンティストのためのDocker • 考えの木のプロンプティングによる推論 • さらに多くの内容!

fairseqのwmt19翻訳システムをtransformersに移植する

Stas Bekmanさんによるゲストブログ記事 この記事は、fairseq wmt19翻訳システムがtransformersに移植された方法をドキュメント化する試みです。 私は興味深いプロジェクトを探していて、Sam Shleiferさんが高品質の翻訳者の移植に取り組んでみることを提案してくれました。 私はFacebook FAIRのWMT19ニュース翻訳タスクの提出に関する短い論文を読み、オリジナルのシステムを試してみることにしました。 最初はこの複雑なプロジェクトにどう取り組むか分からず、Samさんがそれを小さなタスクに分解するのを手伝ってくれました。これが非常に助けになりました。 私は、両方の言語を話すため、移植中に事前学習済みのen-ru / ru-enモデルを使用することを選びました。ドイツ語は話せないので、de-en / en-deのペアで作業するのははるかに難しくなります。移植プロセスの高度な段階で出力を読んで意味を理解することで翻訳の品質を評価できることは、多くの時間を節約することができました。 また、最初の移植をen-ru / ru-enモデルで行ったため、de-en / en-deモデルが統合されたボキャブラリを使用していることに全く気づいていませんでした。したがって、2つの異なるサイズのボキャブラリをサポートするより複雑な作業を行った後、統合されたボキャブラリを動作させるのは簡単でした。 手抜きしましょう 最初のステップは、もちろん手抜きです。大きな努力をするよりも小さな努力をする方が良いです。したがって、fairseqへのプロキシとして機能し、transformersのAPIをエミュレートする数行のコードで短いノートブックを作成しました。 もし基本的な翻訳以外のことが必要なければ、これで十分でした。しかし、もちろん、完全な移植を行いたかったので、この小さな勝利の後、より困難な作業に移りました。 準備 この記事では、~/portingの下で作業していると仮定し、したがってこのディレクトリを作成します:…

Covid-19への闘いを加速する:研究者がAIによって生成された抗ウイルス薬を検証し、将来の危機における迅速な薬剤開発の道を開拓

IBMとオックスフォード大学の研究者による最近の研究により、抗ウイルス薬の開発における画期的な成果が明らかになりました。研究者は生成型人工知能(AI)を利用して、Covid-19を引き起こすSARS-CoV-2ウイルスを阻止する可能性のある新しい分子を設計しました。この手法は成功し、従来の方法を使用する場合よりもずっと短い時間で、チームは4つの潜在的なCovid-19抗ウイルス薬を特定しました。この研究は、Science Advancesに掲載され、危機時に新しい治療法を探すために生成型AIの力を示しています。 従来の薬剤開発プロセスは通常遅く、時間がかかり、10年以上かかることもあります。しかし、Covid-19パンデミックは新しい治療法の迅速な開発を必要とし、学界と産業界の間で前例のない協力が行われました。成功した多くの薬剤は既存の治療法を再利用したものです。しかし、ウイルスが変異するため、これらの薬剤の効果は時間とともに減少し、新しい抗ウイルスソリューションの必要性が浮き彫りになっています。 生成型AIは、ウイルスタンパク質の異なる部位をターゲットにすることができる完全に新しい分子の作成を可能にすることで、潜在的な解決策を提供します。CogMolと呼ばれるAIモデルは、大量の分子とその結合特性のデータセットでトレーニングされました。重要なことは、SARS-CoV-2ウイルスの3D構造や既知の結合分子に関する情報は提供されていませんでした。これにより、モデルはターゲットタンパク質のアミノ酸配列に基づいて新しい分子を生成することができました。 CogMolは、875,000の候補分子のプールを成功裡に生成し、予測モデルと逆合成予測を使用して絞り込みました。最終的な選択により、8つの新しい化合物が合成され、ターゲットタンパク質の阻害効果とウイルスの中和能を評価するためにテストおよび分析されました。これらの化合物のうち2つは主プロテアーゼをターゲットにし、他の2つはスパイクタンパク質をターゲットにしながらも、すべての主要なCovid変異体を中和する能力を持っていました。 これらの分子を薬剤に開発する前に、さらなる研究と臨床試験が必要ですが、この研究は生成型AIが薬剤開発の分野を革新する可能性を示しています。これは、将来のウイルスの変異とパンデミックに対応するために、潜在的な抗ウイルス薬を特定するためのより速くて柔軟なアプローチを提供します。 結論として、この研究は生成型AIが抗ウイルス薬の発見と設計において持つ可能性を示しています。CogMolのようなAIモデルを活用することで、従来の方法と比較して、Covid-19治療のための有望な分子を特定するためにかかる時間を大幅に短縮することができました。この画期的な成果は、進化するウイルスと将来のパンデミックに直面して、新しい薬剤開発の可能性を広げるものです。

Find the right Blockchain Investment for you

Web 3.0 is coming, whether buy Coins, NFTs or just Coding, everyone can participate.

Advertising with us