「トランスフォーマーの単純化:あなたが理解する言葉を使った最先端の自然言語処理(NLP)— パート1 — イントロ」
Transformer Simplified Cutting-edge Natural Language Processing (NLP) Using Understandable Language - Part 1 - Intro
Transformer(トランスフォーマー)は、AIの進歩に非常に貢献したディープラーニングのアーキテクチャです。これはAIとテクノロジー全体の領域において重要な段階であり、少し複雑でもあります。現在では、Transformerに関する非常に良質なリソースがいくつか存在していますが、なぜまた別のものを作るのでしょうか?その理由は2つあります:
- 私は自己学習に精通しており、異なる人々が同じアイデアをどのように説明しているかを読むことが、理解を大幅に向上させることを経験から知っています。
- 私はほとんどの記事を読んで、それが十分に説明されているとは思わないことが非常に稀です。テクノロジーコンテンツの作成者は、概念を複雑にしすぎるか、説明不足になる傾向があります。何事も難解なものではないことを十分に理解しておくべきです。このシリーズでは、十分な説明をすることを試みます。
さらに、記事やオープンソースのコードのおかげでキャリアを築いている者として、お返しをする責任を感じています。
このシリーズでは、AIについてほとんど何も知らない人々と、機械学習の仕組みを知っている人々の両方に、合理的なガイドを提供しようとします。そのためにはどのような計画を立てているのでしょうか?まず第一に、説明することです。私はこれまでに1000近くの技術論文(例えば、これ)を読んだと思いますが、私が直面した主な問題は、著者(おそらく無意識のうちに)が多くのことを知っていることを前提としていることです。このシリーズでは、私はあなたが知っていることよりも少ないことを前提として計画しています。
さらに、直感、数学、コード、視覚化を組み合わせることで、このシリーズを誰にでも楽しんでもらえるようにデザインします。これは非常に複雑な分野における高度な概念であることを考慮に入れると、あなたが「うわー、これは遅い、当たり前のことを説明するのを止めてくれ」と思うリスクを冒しますが、もし「何を言っているのかさっぱりわからない」と思うのであれば、そのリスクはずっと少ないはずです。
- テキストからビデオ生成 ステップバイステップガイド
- 「Transformerベースの拡散モデルによる画像生成の革新的なアーキテクチャイノベーションを実現するDiffusion Transformers(DiTs)」
- LangChain + Streamlit + Llama ローカルマシンに会話型AIをもたらす
Transformer(トランスフォーマー)、時間の価値はあるか?
一体何が大騒ぎなのでしょうか?本当に重要なのでしょうか?それは、世界で最も先進的なAI技術ツール(例:GPTなど)の基盤となっているからでしょう。
多くの科学的な進歩と同様に、アイデアの一部は以前から説明されていましたが、アーキテクチャの詳細な説明は「Attention is all you need」という論文から提供されました。この論文は、次のような「シンプルなネットワークアーキテクチャ」だと主張しています。
もしもあなたがほとんどの人と同じであれば、この図がシンプルなネットワークアーキテクチャだとは思わないでしょう。したがって、私の仕事は、このシリーズを読み終えた時点で、あなたが「これはまだシンプルではないが、理解できる」と思うように努力することです。
では、この変な図、何なの?私たちが見ているのはディープラーニングのアーキテクチャであり、それぞれの四角形はコードの一部に変換され、それらのコード全体が現在、人々がどのようにするかわからない何かを実行するでしょう。
Transformerは多くの異なるユースケースに適用できますが、おそらく最も有名なのは自動チャットです。多くの話題について知っているかのように話すことができるソフトウェアです。ある意味でマトリックスに似ています。
私は人々が実際に必要な情報だけを読むことが容易になるようにしたいので、このシリーズは私がTransformerのストーリーを伝える方法に基づいて分割されます。最初の部分はこちらであり、アーキテクチャの最初の部分— 入力についてです。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- 「転移学習の非合理的な効果」
- 「教師付き機械学習と集合論を通じた現実世界の時系列異常検出」
- 「Tabnine」は、ベータ版のエンタープライズグレードのコード中心のチャットアプリケーション「Tabnine Chat」を導入しましたこれにより、開発者は自然言語を使用してTabnineのAIモデルと対話することができます
- 効率化の解除:Amazon SageMaker Pipelinesでの選択的な実行の活用
- 「AIプロジェクトはどのように異なるのか」
- 「Embroid」を紹介します:複数の小さなモデルから埋め込み情報を組み合わせるAIメソッドで、監視なしでLLMの予測を自動的に修正することができます
- 「ONNXフレームワークによるモデルの相互運用性と効率の向上」