「自然言語処理入門」

Introduction to Natural Language Processing

Pythonコードの10行で複雑なNLPタスクを解決する方法

著者による生成された画像

NLP(自然言語処理)は、コンピュータ科学の複雑な分野であると言えます。SpaCyやNLTKなどのフレームワークは大規模であり、学習が必要なことが多いです。しかし、オープンソースの大規模言語モデル(LLM)とモダンなPythonライブラリの助けを借りれば、多くのタスクをより簡単に解決することができます。さらに、数年前までは科学論文でのみ利用可能だった結果も、たった10行のPythonコードで実現できるようになりました。

それでは、早速始めてみましょう。

1. 言語翻訳

Google翻訳がどのように機能するのか気になったことはありますか?Googleは、膨大なテキストデータでトレーニングされた深層学習モデルを使用しています。今では、Transformersライブラリの助けを借りて、Google Labsだけでなく、普通のPC上でも同様のことができるようになりました。この例では、事前にトレーニングされたT5-base(Text-to-Text Transfer Transformer)モデルを使用します。このモデルは、まず生のテキストデータでトレーニングされ、次に「英語からドイツ語に翻訳する:家は素晴らしい」というようなソース-ターゲットのペアでファインチューニングされました。ここで、「英語からドイツ語に翻訳する」はモデルに何をするかを「伝える」接頭辞であり、フレーズはモデルが学習すべき実際の文脈です。

重要な警告。大規模な言語モデルは非常に大きいです。この例では使用されているT5ForConditionalGenerationクラスは、「t5-base」という約900MBのモデルを自動的にダウンロードします。コードを実行する前に、十分なディスク容量があることと、トラフィックが制限されていないことを確認してください。

事前にトレーニングされたT5モデルをPythonで使用することができます:

from transformers import T5Tokenizer, T5ForConditionalGenerationpreprocessed_text = "translate English to German: the weather is good"tokenizer = T5Tokenizer.from_pretrained('t5-base',                                        max_length=64,                                        model_max_length=512,                                        legacy=False)tokens = tokenizer.encode(preprocessed_text,                          return_tensors="pt",                          max_length=512,                          truncation=True)model =…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI研究

希望、恐怖、そしてAI:AIツールに対する消費者の態度に関する最新の調査結果

米国の消費者が人工知能(AI)に関する意見と認識について述べた最新の「Trust Survey」の結果を明らかにしたThe Vergeの報告...

AIニュース

「GPT-4と説明可能なAI(XAI)によるAIの未来の解明」

はじめに 常に進化し続ける人工知能(AI)の世界で、GPT-4は人間のようなテキスト生成の驚異です。それはまるで自分の言語を...

AI研究

「ユーレカ!NVIDIAの研究によるロボット学習の新たな進展」

ロボットに複雑なスキルを教えることができるNVIDIA Researchによって開発された新しいAIエージェントは、ロボットの手にペン...

AI研究

インテルの研究者たちは、CPU上でLLMs(Large Language Models)をより効率的に展開するための新しい人工知能のアプローチを提案しています

大型言語モデル(LLM)は、その驚異的なパフォーマンスと多様なタスクでの潜在能力により、世界中で話題となっています。テキ...

機械学習

「拡散を支配するための1つの拡散:マルチモーダル画像合成のための事前学習済み拡散モデルの調節」

画像生成AIモデルは、ここ数ヶ月でこの領域を席巻しています。おそらく、midjourney、DALL-E、ControlNet、またはStable dDif...

機械学習

このAI論文は、コントロール可能なマルチビュー画像生成および3Dコンテンツ作成を革新するニューラルネットワークアーキテクチャー、MVControlを紹介しています

最近、2D画像制作の驚くべき進展がありました。テキストの入力プロンプトにより、高精細なグラフィックスを簡単に生成するこ...