StackOverflowの転機:破壊から機会への転換
StackOverflow Transition from Crisis to Opportunity
OverFlowAIは企業のコアアセットを取り入れ、使いやすいインターフェースで回答を公開し、新しいコンテンツを作成するためのジェンAIループを作成します
GPT4のような非常に効果的なモデルがジェネラティブAIを強化することで、データの専門家は所属する組織に対して長期的な価値を提供する方法が進化しています。真の価値は、ただ部屋で最も技術的に優れた人物であるだけでなく、これが製品やビジネスの成果にどのように影響を与えるかを形成できる能力によって生まれます。これには、組織を適切なデータ戦略に導き、データ製品を製品体験にシームレスに結びつける能力が含まれます。この記事の分析は、StackOverflowの変革を目指す魅力的な事例研究として機能します。
プログラミングのサポートにおいてソフトウェア開発者が最もよく使用するプラットフォームであるStackOverflowは、最近厳しい状況に直面しています。StackOverflowを以前使ったことがない場合、それはプログラミングに関連する質問をすることができるQuora / RedditのようなQ&Aフォーラムです。私が本格的なコードを書いていたのは数年前のことですが、当時のStackOverflowは素晴らしかったです。たとえば、コードをコンパイルしている最もマイナーなエラーに遭遇し、意味がわからないエラーメッセージを受け取った場合、それをGoogle検索に入力します。ほとんどの場合、同じ質問をした人が回答を得たStackOverflowのページを見つけることができます。稀に、あなたとまったく同じマイナーな問題を抱えている他の人物を見つけることもできますが、それに回答はありません-その場合、幸運を祈ります。具体的には、StackOverflowの質問の69%が回答されており、これは非常に印象的です。
しかし最近、StackOverflowのトラフィックは減少しています。Similarwebのデータによれば、そのトラフィックは前年比で14%減少しました(StackOverflowは5%に近いと述べています)。それにもかかわらず、この傾向は下降しており、主な要因はChatGPTやGitHub CopilotなどのAIコーディング製品の登場です。これらの製品は意味のあるコード作成能力を持っているため、StackOverflowと同等のプログラミングサポートを提供することができます。皮肉なことに、これらのAI製品の背後にあるいくつかの大規模言語モデル(LLM)は、スクレイピングされたStackOverflowのデータを使用してトレーニングされました。
この動向に対して、同社は非常に厳しいメディア報道を受けています。Business Insiderの「LLMによる死」の記事では次のように書かれています:
AIの世界におけるインターネットの未来へようこそ。Stack OverflowやWikipediaのようなオンラインコミュニティは、専門家や好奇心旺盛なユーザーが情報を自由に共有する場として繁栄しました。しかし、これらのデジタルな集まりは、大手テック企業が人間のデータを探し求めて大規模な言語モデルを訓練するために略奪しています。
ジェネラティブAIのブームから生まれた新しい製品は、質問に明確で自動的な回答を提供し、しばしば愉快に対応するため、人間同士で情報を共有する必要がなくなっています。
この注目の中で、StackOverflowは着実に対処するための2つの手法を明確にしました:
- 数週間前、彼らはプラットフォームの50M以上の質問と回答をモデルトレーニングに使用する大規模AI開発者に料金を請求することを発表しました(以前のデータスクレイピングの記事でこの問題について調査しました)
- 先週、OverflowAI製品を発売しました。これは実際に役立つジェネラティブAIの機能セットであり、彼らの第2のイニングをスタートさせるのに役立ちます-今日はこれに焦点を当てます
この記事では、以下の内容について詳しく説明します:
- StackOverflowに影響を与えるAIコード作成ツール
- OverflowAIの機能
- StackOverflowの戦略から見える underlying なトレンド
StackOverflowに影響を与えるAIコード作成ツール
現在、市場にはいくつかのAIコード作成および編集ツールがあります。これらは独立した製品(OpenAI Codex、ChatGPT、Google Bardなど)または既存のプラットフォーム(GitHub Copilot、Replit Ghostwriter、Amazon CodeWhispererなど)にネイティブに統合された製品のいずれかです。これらはコード生成、コード編集、自動補完、デバッグなど、幅広い機能を持っています。
ネイティブディストリビューションを持つ製品(例:GitHub Copilot)は、既存の環境内でシームレスに動作できるため、既にプログラマーが使用している環境での利点が大きいです。今後、既存の環境に接続しようとする製品が増えるでしょう。例えば、CodeGPTには、開発者がVisual Studio Code(人気のあるコード編集ツール)内から製品を使用できるプラグインがあります。
既存のAIコード生成ツールは、特定のタスクにおいて優れた性能を発揮します。例えば、このRedditスレッドでは、GitHub Copilotについてのいくつかのウェブ開発者からのフィードバックが収集されており、その大まかなテーマは、開発者が新しいコードを書かなければならず、ゼロから書く時間を節約したい場合に、この製品が有用であるというものです。しかし、これらの状況でも、結果は当たり外れがあります。
その理由は驚くべきものではありません。概念的には、大規模言語モデル(LLM)は膨大なデータを取り入れ、次の単語/テキストが前の単語に続く可能性が最も高いものとして出力を生成する構造に基づいています。つまり、特定の文脈で、あなたが尋ねた質問に対して、前の単語の後に続く最も可能性の高い単語/テキストを計算し、それに基づいて出力を生成しています。これは、単語が別の単語に続く確率を計算し、それに基づいて出力を生成するものです。これらのモデルのトレーニングに使用されたデータの量を考慮すると、より一般的なChatGPTのユースケース(メールの作成やページの要約など)において、その結果は非常に印象的です。ただし、言語モデルは設計上、限定された分析/数学的な能力しか持っていません。言い換えると、モデルに「2+2は何ですか」と尋ねると、正しい答えを返すかもしれませんが、それは数学を知っているからではなく、トレーニングデータでそのテキストパターンを見たからです。
同様に、コード生成に関しても、モデルは実際にはプログラミングの基礎概念を「知っている」わけではなく、膨大なテキストデータでのトレーニングに基づいて結果を予測しています。これによる結果がGitHub Copilotのフィードバックに現れており、必要なベースコードの生成にはうまく機能する一方で、コードを実際に理解し、デバッグし、説明を提供する能力は限定されています。これは将来的に改善されるでしょうが、高い正確性/高い信頼性のレベルに到達するかどうかはわかりません。
StackOverflowのCEOであるPrashanth Chandrasekarは、次のように簡潔に説明しています:
現代のLLMシステムの問題は、正しい回答と同じ自信を持って不正確な回答を提供し、ユーザーが求める回答のパターンに合うように事実や数値を「幻想」することです。
ある時点で、あなたが何を構築しているのかを知る必要があります。デバッグしなければならない場合もあり、作成されたものが何であるのかが分からないこともあります。学習の旅をショートカットすることは難しいです。
これがStackOverflowの機会です。彼らのトラフィックの減少は恒久的なものかもしれず、プログラマーがより簡単な質問のためにStackOverflowに頻繁に訪れなくなる可能性が非常に高いです(例:既製のソートアルゴリズムについてはStackOverflowにもう訪れないかもしれません)。しかし、製品が輝く可能性のある点は、以下の2つです:1)言語モデルが回答できないより複雑な質問に対して高い正確性/高い信頼性の回答を提供すること、および2)モデルが以前のデータでトレーニングされていない新しい技術/問題領域の質問に回答すること。OverflowAIは、直接この機会を利用するために設計されています。
OverflowAIの機能
彼らが賭けている3つの主要な側面があります。それは、質問に直接回答すること、開発者環境内での利用性、およびエンタープライズ内の知識のスーパーチャージです。
OverflowAI検索は、Q&A形式でユーザーに直接回答を提供します(ChatGPTと同様ですが、実際のStackOverflowの投稿へのリンクも提供します)。これは信頼性を確保するだけでなく、ユーザーにAIによる提供された回答が完全に問題を解決しない場合に深く探求する機会も提供します。これにより、質問が簡単な場合は直接回答を提供し、困難な質問に対してはユーザーを探求的なパスに導くという微妙なバランスを実現しています。
ユーザーが回答に満足していない場合、チャットのようなインタフェースで追加の質問をすることができます。回答がいずれも満足できない場合、ユーザーはStackOverflowに自分の代わりに質問を起草するよう依頼することができます。この体験は、ユーザーが既に以前に回答された質問をするという状況からも救ってくれます。
また、この製品は、Visual Studio Codeの拡張機能を通じてすべての機能が利用可能であることにより、使いやすさにも重点を置いています。これにより、開発者はコーディング環境内から回答を得ることができ、ブラウザからの切り替えや検索の手間を省くことで、StackOverflowが統合されたコーディングアシスタントと競争する能力が向上します。
さらに、企業の顧客向けに、OverflowAIは企業内のさまざまな情報源を接続する機能を作成しており(内部のQ&A、ウィキページ、ドキュメントリポジトリなど)、開発者にとって統一されたQ&A体験を提供します。内部およびStackOverflowのデータを利用できること、さらにそれを簡単にQ&Aタイプのインターフェースで公開できることは、エンジニアリング組織にとって大きな生産性向上となるでしょう。彼らはまた、この機能を公開するためのシームレスなインターフェースとしてSlackの統合を導入する予定です。
OverflowAIの製品アプローチの印象的な点は、会社の中核資産(難しい質問への回答)を取り入れ、回答を利用者がいる場所(Slackや開発者環境など)で非常に使いやすいインターフェースで公開し、利用者が生成AIを活用して新しい質問を提出できるループを作り出していることです。
StackOverflow戦略の基本的なトレンド
StackOverflowは公開企業ではありません。StackOverflowはProsusという企業に所有されており、さらに大きな持株会社であるNaspersが公開企業です。そのため、正確な収益データを得るのは難しいですが、2022年5月にProsusが発表した報告書によれば:
- 同社は2022年に約8900万ドルの収益を上げ、そのうち企業向け製品StackOverflow for TeamsとReach製品(広告および雇用主ブランディング)の収益が50-50で分かれていました
- 2021年から2022年にかけて、StackOverflow for Teamsの収益は69%増加した一方、Reach製品の収益は12%減少していました(採用の遅れなどの外部要因が2022年の収益に影響を与えた可能性もあります)
この収益データとOverflowAIの製品の内容から、StackOverflowがGenerative AIの世界で向かっている方向性を示すいくつかの明確なトレンドが浮かび上がります(これらのトレンドは他のQ&Aプラットフォームにも拡張できる可能性があります):
- トラフィックに直接関連する広告ビジネスが減少しています。これは必ずしも深刻な状況ではありませんが、より広範なトレンドを示しており、より簡単な質問に直接回答が得られるため、目にする人やページビューが減少し、その結果広告はより重要な収益源ではなくなっています。
- StackOverflowは難しい質問の回答の貴重な情報源であり続けるでしょうし、会社のGenerative AIの推進により、質問と回答の数量は増加し続けます。さらに、StackOverflowがコンテンツエンジンを稼働させ続けることができれば、プラットフォーム上のコンテンツの質も向上するでしょう。なぜならば、繰り返しの質問や簡単な質問が最も多いコンテンツではなくなるからです。
- StackOverflowは、利用者に最も価値を提供できるエクスペリエンスを構築するために取り組みを倍増させ、これらの優れたエクスペリエンスに対して支払いを行ってくれる顧客に焦点を当てることで、製品ラインに注力します(例:StackOverflow for Teamsなど)
- AI企業に対してデータのトレーニングに対する料金を請求するデータライセンスプログラムが加速するでしょう
これらのトレンドは、StackOverflowが企業の次のフェーズに成功して転換しており、潜在的な混乱を乗り越えるために正しい製品/事業投資を行ってきたことを示しています。さらに、彼らは他のQ&Aプラットフォームが利用するための貴重なコミュニティーサービスを提供し、プラットフォーム上のコンテンツエコシステムが将来的に繁栄することを期待しています。
🚀 もしこの記事が気に入ったら、私の週刊ニュースレターの購読を検討してみてください。毎週、私は現在のテックトピック/製品戦略についての詳細な分析を10分で読める形式で公開しています。よろしくお願いします、Viggy。
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles