「StackOverflowが生成型AIに対応する方法」

StackOverflowの生成型AIへの対応方法

プログラミングサポートのためにソフトウェア開発者によって最もよく使用されるプラットフォームであるStackOverflowは、最近困難な時期を過ごしています。質問の69%が回答されているにもかかわらず、StackOverflowのトラフィックは減少しています。Similarwebのデータによれば、トラフィックは前年比で14%減少しました(StackOverflowは5%に近いと述べています)。それにもかかわらず、この傾向はAIコーディング製品(ChatGPTやGitHub Copilotなど)の台頭によって主に説明されます。これらの製品は意味のあるコードの書き込み能力を持っており、そのためStackOverflowと同等のプログラミングサポートを提供することができます。皮肉なことに、これらのAI製品の背後にあるいくつかの大規模言語モデル(LLM)は、スクレイピングされたStackOverflowのデータを使用してトレーニングされました。

このような展開により、StackOverflowは厳しいメディア報道を受けています。Business Insiderの「LLMによる死」の記事では、次のように書かれています。

AIの世界でのインターネットの未来へようこそ。Stack OverflowやWikipediaのようなオンラインコミュニティは、専門家や好奇心を持ったユーザーが自由に情報を共有するための拠点として繁栄しました。しかし、これらのデジタルな集まりは、大手テック企業が自社の大規模言語モデルを訓練するために人間のデータを略奪しているため、危機に瀕しています。

この生成AIブームから生まれた新製品により、これらのオンラインフォーラムの未来が疑問視されています。チャットボットは質問に明確かつ自動的に答え、しばしば快適に対応するため、情報を得るために人間同士でやり取りする必要がありません。

このような注目の中、StackOverflowは着実な手を打ち、この課題に取り組むための2つのアプローチを明確に示しています:

  1. 数週間前、プラットフォームの5000万以上の質問と回答を使用する大規模AI開発者に課金すると発表しました(以前のデータスクレイピングの記事で詳しく取り上げました)。
  2. 先週、OverflowAI製品を発売しました。これは実際に役立つ生成AI機能のセットであり、彼らの第二のイニングをスタートさせるのに役立つものです。今日はこれに焦点を当てます。

この記事では、以下の内容について詳しく説明します:

  • StackOverflowに影響を与えるAIコード作成ツール。
  • OverflowAIの機能。
  • StackOverflowの戦略から読み取れるトレンド。

StackOverflowに影響を与えるAIコード作成ツール

現在、市場にはいくつかのAIコード作成および編集ツールがあります。これらは独立した製品(OpenAI Codex、ChatGPT、Google Bardなど)または既存のプラットフォームに統合された製品(GitHub Copilot、Replit Ghostwriter、Amazon CodeWhispererなど)のいずれかです。これらはコードの生成、編集、オートコンプリート、デバッグなど、幅広い機能を備えています。

既存の配布製品(GitHub Copilotなど)は大きな利点を持っています。なぜなら、それらは既存のプログラマが今日使用している環境内でシームレスに動作することができるからです。そして、既存の環境に接続しようとする製品がさらに増えるでしょう。たとえば、CodeGPTには、開発者が人気のあるコード編集ツールであるVisual Studio Codeから製品を使用できるプラグインがあります。

既存のAIコード作成ツールは特定のタスクにおいて優れた性能を発揮します。たとえば、このRedditスレッドでは、GitHub Copilotについての多くのウェブ開発者からのフィードバックがまとめられています。その大まかなテーマは、この製品が新しいコードを書かなければならない状況の一部で有用であり、ゼロから書く時間を省きたい場合に役立つというものです。しかし、それでも場合によってはうまくいかないこともあります。

その理由は驚くべきものではありません。概念的には、大規模言語モデル(LLM)は膨大なデータを受け取り、この構造に基づいて出力を生成します:特定の文脈において、あなたが尋ねた質問に対して、前の単語に続く最もありそうな単語/テキストは何ですか?本質的には、単語の後に続く単語の確率を計算し、それに基づいて出力を生成するものです。これらのモデルのトレーニングに使用されたデータの量を考慮すると、より一般的なChatGPTのような用途(メールの起案やページの要約など)に対する結果は非常に印象的です。ただし、言語モデルは設計上、限定的な分析/数学的な能力しか持ちません。言い換えれば、モデルに「2 + 2は何ですか?」と尋ねると、正しい答えを得るかもしれませんが、それは数学を知っているからではなく、トレーニングデータでそのテキストパターンを見たからです。

同様に、コードの生成に関しては、モデルは実際には「プログラミングの基本的な概念を理解している」とは言えず、大量のテキストデータに基づいて結果を予測しています。その結果、GitHub Copilotのフィードバックは上記のようになります。必要な基本的なコードを生成するのにはうまく機能しますが、コードを実際に理解し、デバッグし、説明を提供する能力は限定されています。これは時間とともに改善されるでしょうが、高い正確性/信頼性に到達するかどうかはわかりません。

StackOverflowのCEOであるPrashanth Chandrasekarは、次のように簡潔に説明しています:

現代のLLMシステムの1つの問題は、正しい回答と同じ自信を持って間違った回答を提供し、ユーザーが求める回答のパターンに合うと感じた場合には事実や数字を「幻想」することです。

いつかは、自分が何を構築しているのかを知る必要が出てきます。デバッグしなければならず、自分が構築したものが分からないということもあります。学習の旅を省略することは難しいです。

これがStackOverflowの機会です。彼らのトラフィックの減少は恒久的なものかもしれませんし、プログラマーがより簡単な質問のためにStackOverflowに頻繁に訪れなくなる可能性も非常に高いです(例えば、既製のソートアルゴリズムについてはもはやStackOverflowを訪れないかもしれません)。しかし、製品が輝けるのは、1)言語モデルが回答する能力を持っていないより複雑な質問に対して高い精度/高い信頼性の回答を提供し、2)モデルが以前のデータをトレーニングすることができなかった新しい技術/問題領域の質問に回答することです。OverflowAIは、この機会に直接アクセスするために設計されています。

OverflowAIの機能

彼らが賭けている3つの主な要素があります – 質問への直接回答、開発者環境内からの使用可能性、そして企業内の知識を強化することです。

OverflowAI検索は、Q&A形式でユーザーに直接回答を提供します(ChatGPTと同様ですが、実際のStackOverflowの投稿へのリンクも提供します)。これは信頼を築くだけでなく、AIによる提供された回答がユーザーの問題を完全に解決しない場合に、ユーザーがより深く探求する機会を提供します。これは、質問が単純な場合に直接回答を提供することと、困難な質問に対してユーザーをより探索的なパスに導くという微妙なバランスを取ります。

OverflowAI検索

ユーザーが回答に満足していない場合、チャットのようなインターフェースで追加の質問をすることができます。回答がいずれも満足のいくものではない場合、ユーザーはStackOverflowに代わりに質問を作成するよう依頼することができます。これにより、ユーザーがすでに回答されている質問を投稿するという状況からも救われます。

自動質問作成

製品はまた、すべての機能をVisual Studio Codeからのエクステンションで使用できるようにすることで、使いやすさに重点を置いています。これにより、開発者はコーディング環境内から回答を得ることができるため、ブラウザから切り替えて検索する必要がなく、ネイティブに統合されたコーディングアシスタントとより効果的に競合することができます。

Visual Studio Code内のエクステンション

さらに、企業の顧客には、OverflowAIが会社内のさまざまな情報源(内部のQ&A、ウィキページ、ドキュメントリポジトリ)をプラグインする機能を提供しています。これにより、エンジニアリング組織にとって大きな生産性向上の要因となる、内部およびStackOverflowのデータを利用できるだけでなく、それを簡単にQ&Aタイプのインターフェースで公開することができます。彼らはまた、この機能を公開するためのシームレスなインターフェースとしてSlackの統合を開始する予定です。

StackOverflowの戦略からの基本的なトレンド

StackOverflowは公開企業ではありません – 彼らは公開企業であるNaspersの一部であるProsusによって所有されています。そのため、正確な収益データを得るのは難しいですが、2022年5月にProsusが公開した報告書により一部が明らかになりました:

  • 同社の収益は2022年に約8900万ドルで、エンタープライズ製品のStackOverflow for TeamsとReach製品(広告および雇用主ブランディング)の間で50-50の割合で分割されました。
  • 2021年から2022年にかけて、StackOverflow for Teamsの収益は69%増加しましたが、Reach製品の収益は12%減少しました(2022年の収益には、採用の遅れなどの外的要因が影響した可能性があります)。

StackOverflowの所有者であるProsusによる収益データ(2022年5月報告)。

この売上データは、OverflowAI製品が行っていることと組み合わさることで、StackOverflowがジェネラティブAIの世界に向かっている明確なトレンドを示しています(これらのトレンドは他のQ&Aプラットフォームにも拡張できます):

  • 彼らの広告事業は、その成功がトラフィックに直接関連しているため、衰退しています。これは必ずしも深刻な状況ではなく、より広範なトレンドを指しています。消費者はより簡単な質問に直接回答を得るため、おそらく目にする人数/ページビューが少なくなるでしょう(これは良いことです)。そのため、広告は収益の重要な源泉ではなくなります。
  • StackOverflowは難しい質問の回答の貴重な情報源として続けていくでしょうし、企業のジェネラティブAIプッシュにより、質問と回答の量は増え続けるでしょう。さらに、StackOverflowがコンテンツエンジンを動かし続けることができれば、プラットフォーム上のコンテンツの品質も向上するでしょう。再発性のある/簡単な質問は最も多いコンテンツではなくなるからです。
  • StackOverflowは、彼らがユーザーに最も価値を提供できる体験を構築することに力を入れ続けるでしょう(OverflowAI検索やVisual Studio Code拡張機能など)、そして、これらの優れた体験に対して支払いをする顧客がいる製品ラインに焦点を当てるでしょう(例:StackOverflow for Teams)。
  • データライセンスプログラムでは、AI企業がデータのトレーニングに対して料金を支払うことが加速します。

これらのトレンドは、StackOverflowが会社の次のフェーズに成功裏に転換しており、潜在的な混乱を乗り切るために正しい製品/ビジネス投資を行っていることを指しています。さらに、彼らは他のQ&Aプラットフォームが活用できる貴重なコミュニティサービスを提供し、プレイブックを提示しています。全体的に、彼らの進む方向には楽観的であり、これが将来的に繁栄するコンテンツ生態系を引き起こすでしょう。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more