「トランスフォーマーの単純化:あなたが理解する言葉を使った最先端の自然言語処理(NLP)— パート1 — イントロ」

Transformer Simplified Cutting-edge Natural Language Processing (NLP) Using Understandable Language - Part 1 - Intro

Transformer(トランスフォーマー)は、AIの進歩に非常に貢献したディープラーニングのアーキテクチャです。これはAIとテクノロジー全体の領域において重要な段階であり、少し複雑でもあります。現在では、Transformerに関する非常に良質なリソースがいくつか存在していますが、なぜまた別のものを作るのでしょうか?その理由は2つあります:

  1. 私は自己学習に精通しており、異なる人々が同じアイデアをどのように説明しているかを読むことが、理解を大幅に向上させることを経験から知っています。
  2. 私はほとんどの記事を読んで、それが十分に説明されているとは思わないことが非常に稀です。テクノロジーコンテンツの作成者は、概念を複雑にしすぎるか、説明不足になる傾向があります。何事も難解なものではないことを十分に理解しておくべきです。このシリーズでは、十分な説明をすることを試みます。

さらに、記事やオープンソースのコードのおかげでキャリアを築いている者として、お返しをする責任を感じています。

このシリーズでは、AIについてほとんど何も知らない人々と、機械学習の仕組みを知っている人々の両方に、合理的なガイドを提供しようとします。そのためにはどのような計画を立てているのでしょうか?まず第一に、説明することです。私はこれまでに1000近くの技術論文(例えば、これ)を読んだと思いますが、私が直面した主な問題は、著者(おそらく無意識のうちに)が多くのことを知っていることを前提としていることです。このシリーズでは、私はあなたが知っていることよりも少ないことを前提として計画しています。

さらに、直感、数学、コード、視覚化を組み合わせることで、このシリーズを誰にでも楽しんでもらえるようにデザインします。これは非常に複雑な分野における高度な概念であることを考慮に入れると、あなたが「うわー、これは遅い、当たり前のことを説明するのを止めてくれ」と思うリスクを冒しますが、もし「何を言っているのかさっぱりわからない」と思うのであれば、そのリスクはずっと少ないはずです。

Transformer(トランスフォーマー)、時間の価値はあるか?

一体何が大騒ぎなのでしょうか?本当に重要なのでしょうか?それは、世界で最も先進的なAI技術ツール(例:GPTなど)の基盤となっているからでしょう。

多くの科学的な進歩と同様に、アイデアの一部は以前から説明されていましたが、アーキテクチャの詳細な説明は「Attention is all you need」という論文から提供されました。この論文は、次のような「シンプルなネットワークアーキテクチャ」だと主張しています。

オリジナル論文からのイメージ

もしもあなたがほとんどの人と同じであれば、この図がシンプルなネットワークアーキテクチャだとは思わないでしょう。したがって、私の仕事は、このシリーズを読み終えた時点で、あなたが「これはまだシンプルではないが、理解できる」と思うように努力することです。

では、この変な図、何なの?私たちが見ているのはディープラーニングのアーキテクチャであり、それぞれの四角形はコードの一部に変換され、それらのコード全体が現在、人々がどのようにするかわからない何かを実行するでしょう。

Transformerは多くの異なるユースケースに適用できますが、おそらく最も有名なのは自動チャットです。多くの話題について知っているかのように話すことができるソフトウェアです。ある意味でマトリックスに似ています。

私は人々が実際に必要な情報だけを読むことが容易になるようにしたいので、このシリーズは私がTransformerのストーリーを伝える方法に基づいて分割されます。最初の部分はこちらであり、アーキテクチャの最初の部分— 入力についてです。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

Generating AI(AIを生成する) vs マシンラーニング(機械学習):区別の解読

「ジェネラティブAIと機械学習を使ってデータ駆動型の意思決定の世界を探検しましょうデータ変換におけるそれぞれの違いと役...

機械学習

NLPとAIを利用したPythonにおけるテンプレートベースの文書生成の力

Pythonを利用したテンプレートベースの文書生成の機能をNLPやAIの機能と融合させ、その力を活用してください文書生成の作業フ...

AI研究

「IBMの「脳のような」AIチップが、環境にやさしく効率的な未来を約束します」

興味深い進展として、テクノロジー巨人IBMが人工知能(AI)の世界を革新するかもしれない「脳のような」チップのプロトタイプ...

機械学習

マイクロソフトAIがLLMLinguaを発表:大型言語モデル(LLM)の高速推論のためのユニークなクイック圧縮テクニックでプロンプトを圧縮

大規模言語モデル(LLM)は、その高い一般化能力と推論能力により、人工知能(AI)コミュニティを大きく押し上げています。こ...

AI研究

スタンフォード大学の新しい人工知能研究は、説明が意思決定時のAIシステムへの過度の依存を軽減する方法を示しています

近年の人工知能(AI)のブームは、AIの能力によって仕事がより速く、より少ない労力で行われることによって、人間の生活がど...

データサイエンス

JavaScriptを使用してOracleデータベース内からHugging Face AIを呼び出す方法

JavaScriptとオープンソースを使用して完全に無料でAIアーキテクチャを最適化し、SQL、JSON、またはRESTを使用して同じデータ...