「Hugging FaceのTransformerモデルを使用して、コメントの有害性ランキングを作成する」

「Hugging FaceのTransformerモデルを使用して、コメントの有害性ランキングを作成する」

NLPとLLMに追いつく(パートI)

Brett Jordan氏による写真、Unsplashより

はじめに

データサイエンティストとして、私は自然言語処理の最新の進歩を十分に探求する機会を持ったことがありませんでした。夏と今年の初め以来、大規模言語モデルの新しいブームが起こっているため、この分野に深く没頭し、いくつかのミニプロジェクトに着手する時が来たと判断しました。結局のところ、実践することほど学ぶのに良い方法はありません。

旅が始まると、新しいNLPモデルに関する理解を深めるために、手を取ってステップバイステップで進むコンテンツを見つけるのが難しいことに気付きました。これが私がこの新しいシリーズの記事を始めることを決めた理由です。

HuggingFaceのTransformerモデルを使用したコメント毒性ランカーの構築

この最初の記事では、コメント毒性ランカーの構築に深く入り込んでいきます。このプロジェクトは、去年Kaggleで行われた「Jigsaw Rate Severity of Toxic Comments」コンペティションに触発されています。

コンペティションの目的は、2つのコメント(入力として与えられる)のうち、最も毒性のあるコメントを判定する能力を持つモデルを構築することでした。

そのため、モデルは入力されたすべてのコメントにスコアを割り当て、その相対的な毒性を決定します。

この記事でカバーする内容

この記事では、PyTorchとHugging Faceのtransformersを使って最初のNLP分類器を訓練します。transformersの詳細には触れませんが、実用的な詳細と実装に重点を置き、シリーズの次の記事に役立つ概念を紹介します。

具体的には、以下の内容を見ていきます:

  • Hugging Face Hubからモデルをダウンロードする方法
  • エンコーダをカスタマイズして使用する方法
  • Hugging Faceモデルの1つからPyTorchランカーを構築して訓練する方法

この記事は、実践的な観点からNLPのスキルを向上させたいデータサイエンティストに直接向けられています。…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

ベイリー・カクスマー、ウォータールー大学の博士課程候補 - インタビューシリーズ

カツマー・ベイリーは、ウォータールー大学のコンピュータ科学学部の博士課程の候補者であり、アルバータ大学の新入教員です...

人工知能

「アナコンダのCEO兼共同創業者、ピーターウォングによるインタビューシリーズ」

ピーター・ワンはAnacondaのCEO兼共同創設者ですAnaconda(以前はContinuum Analyticsとして知られる)を設立する前は、ピー...

人工知能

「ゲイリー・ヒュースティス、パワーハウスフォレンジクスのオーナー兼ディレクター- インタビューシリーズ」

ゲイリー・ヒュースティス氏は、パワーハウスフォレンジックスのオーナー兼ディレクターであり、ライセンスを持つ私立探偵、...

人工知能

「シフトのCEOであるクリス・ナーゲル – インタビューシリーズ」

クリスはSiftの最高経営責任者です彼は、Ping Identityを含むベンチャー支援および公開SaaS企業のシニアリーダーシップポジシ...

人工知能

Diginiのスマートセンスの社長、ガイ・イエヒアブによるインタビューシリーズ

ガイ・イハイアヴ氏は、ビジネスの成功に最も重要な資産を保護するためにインターネット・オブ・シングス(IoT)の力を活用す...

データサイエンス

「3つの質問:ロボットの認識とマッピングの研磨」

MIT LIDSのLuca CarloneさんとJonathan Howさんは、将来のロボットが環境をどのように知覚し、相互作用するかについて議論し...