機械学習なしで最初の自動修正を作成する

機械学習なしで自動修正を作成する

独自のスペルチェッカーを構築するためのステップバイステップガイド

Photo by Markus Spiske on Unsplash

スペルの修正はどこにでもあります。私がこの記事を書いている間、Grammarlyは静かにタイプミスを修正してくれています。電子商取引のウェブサイトにクエリを入力すると、まず正しいフレーズに移動して、希望する商品のタイトルとより良く一致させます。

スペルの修正は、書かれたコミュニケーションにおいて間違いなく重要です。コミュニケーションを向上させ、専門性を保ち、生産性を向上させます。スペルチェッカーを構築することを考えると、一つの大きな解決策が浮かび上がってくるかもしれません:ディープラーニング。しかし、ディープラーニングは必ずしも最適な選択肢ではありません。

この記事では、スペル修正のための古典的な技術である「ノイズチャネル」と、ディープラーニングのバックグラウンドを必要としない修正モジュールを構築する方法を紹介します。

ノイズチャネル

私たちは、文書内のすべての単語がある種の「歪み」を受けたノイズチャネルを通過したと考えることができます。私たちは、「デコーダーチャネル」と呼ばれる「歪み」を元に戻すことができるチャネルを学習することを目指しています。

スペルミスの修正には、すべての可能な修正候補を収集し、デコーダーチャネルを通過させて、最も尤度の高い候補を見つけることができます。

Noisy channel and Decoder channel (Image by the author)

機械学習アプローチと比較して、ノイズチャネルは以下の理由からはじめるにはより好ましいと考えています:

  • コスト効率:ディープモデルを構築および維持する必要はありません。ディープラーニングモデルを構築、提供、および維持するリソースを持っているのは一部の人だけです。
  • ホワイトボックス:ノイズチャネルはより解釈可能です。スペルチェッカーから予期しない動作がある場合、スコアをより小さな要素に分解し、問題の発生源を特定することができます。したがって、適切な最適化を行うことができます(例:辞書の拡張、ハイパーパラメータの調整など)。

ただし、アプリケーションのリソースが増えるにつれて、seq2seqなどのディープモデルがより良い選択肢になります:

  • ノイズチャネルには不足がある

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

「Gen-AI:楽しさ、恐怖、そして未来!」

この記事では、AIがイメージ生成に与える影響を探究し、開発者や規制などに対してそれが何を意味するのかを考察します

データサイエンス

「クレジットカードの不履行データセットのバイアスの検証と検出」

このセクションでは、クレジットカードのデフォルトデータセットにおけるバイアスについて探求し、若者と高齢者の借り手の間...

機械学習

詳細に説明されたLlama 2:Metaの大型言語モデル!

MetaのLlama 2についてもっと知りたいですか?ここには基礎から高度な仕様まで、すべてを網羅した初心者向けガイドがあります

機械学習

「LLaMA-v2-Chat対アルパカ:どのAIモデルを使用するべきですか?」

この記事は以下の質問に答えます:LLaMA-v2-Chat vs アルパカ、どちらを使うべきですか?両方のAIモデルの利点と欠点は何です...

機械学習

「ジェネラティブAIおよびMLモデルを使用したメールおよびモバイル件名の最適化」

「ジェネレーティブAIとMLモデルを併用して、最大のエンゲージメントを得るために、トーンと対象読者に合わせた魅力的な件名...

人工知能

ネットワークの強化:異常検知のためのML、AI、およびDLの力を解放する

「機械学習、人工知能、そしてディープラーニング技術が、異常を精度良く検出することでネットワークセキュリティを向上させ...