Note The translation result may vary depending on the context and specific requirements.

「注意翻訳結果は文脈と具体的な要件によって異なる場合があります」

データを分析するのか、現実をエンジニアリングするのか？

Vernagt Ferner — Tyrol Alps. Image by author. — Vernagt Ferner — Tyrol Alps。著者による画像.

イントロダクション

心配はいりません、私はデータサイエンスが「真の科学ではない」と嘆くためにこのタイトルを選ぶわけではありませんでした（それが何を意味するのかはわからないが）。むしろ、データサイエンティストであることの意味についていくつかの異なる視点を提供し、問題を分析する際に異なる視点を持つことを考えるのに役立つことを願っています。本来は、このエッセイを「プラトンとナーディストから学んだときのデータサイエンティストとしての私の学び」と呼ぼうとしていました[1]。プラトンとナードは、エドワード・アシュフォード・リーによって書かれた本です。この本のタイトルは、実際には本書がどのような内容かをうまく伝えていません。ある意味では、これはリーの文章に正当性を与えています。彼は多くの興味深い側面に焦点を当て、彼が「ナードストーム」と呼ぶものに向かって進んでいきますが、彼の本の主旨は不透明のままです。このエッセイでは、彼の本の一つの側面に焦点を当てます：科学とエンジニアリングの違い、およびこれがデータサイエンスにおける一般的な考え方とどのように衝突するか。リーは一般向けに本を書いたとは言え、私はコンピュータサイエンス/情報技術の勉強について考えるのにこの本が特に役立つと感じました。

リーがエンジニアリングと科学の違いをどのように説明しているかという視点から、このエッセイはリーが指摘するように、現在のWikipediaのデータサイエンスページの最初の引用である「[データサイエンスは] 「統計、データ分析、情報科学、およびそれらの関連手法を統一する概念] によって実現された現象を理解し、分析することを目的としています。」（私の強調）[2]という一般的な考えは誤解であるように見えます。このエッセイの残りの部分では、リーの指摘に従い、なぜそうなのかを説明しようとします。まず、私たちが「実際の現象」と最も頻繁に意味するものについて詳しく見てみます。次に、データサイエンスに関して話しているのであれば、リーのエンジニアリングと科学の区別について考えてみます。最後に、データサイエンティストの仕事にこれがどのような意味を持つのかを哲学的に考えます。

Vernagthutte — Tyrol Alps. Image Author — Vernagthutte — Tyrol Alps. 画像の著者

現実をテストする（なぜ必要なのか）

最近、私はBBCのポッドキャスト「You’re Dead to Me」[3]をよく聴いています。これは、歴史コメディのポッドキャストです。特に気に入っているエピソードは、時間の歴史についてのものです。このエピソードでは、現在私たちが当たり前に考えている時間の多くの側面について話しています。時間の概念を常に使っていても、私はこれらの概念がどのように成り立ったのかについてほとんど知らない（または知っていない）ことに気付かされました。私はただ、1時間は60分であるとか、仕事と余暇の時間に違いがあるとか、時間が連続して存在するということを受け入れています。時間に関するこれらのすべての概念は、私たちの文化にまだ反響している人々のビジョンですが、私たちはそれに気付いていません。リーがこれらを「未知の既知事項」と呼ぶのも納得です。未知の既知事項は、異なる名前でも呼ばれます：心のモデル。

科学の重要な課題の一つは、これらの未知の既知事項に気づき、現実との対比をテストすることです。科学の歴史は、そのような例でいっぱいです。コペルニクスの前、一般的な心のモデルは太陽が地球の周りを回っているというものでした。長い間、血を抜くことや水銀の使用は医学的に正当とされていました。統計学自体も未知の既知事項に満ちています。観測値を組み合わせて精度を向上させる、つまり最も「信頼性のある」単一の観測値を選ぶ代わりに平均値を使用するということは、1750年以前には珍しいことであり、しばしば批判されました。オイラーが木星と土星の動きを予測しようとしたとき、彼は最も可能性の高いデータポイントを使用しましたが、全てのデータの平均を使って予測することはしませんでした[4, pp. 25–31]。別の例では、19世紀の経済学者は、複数の製品の価格を1つの指数に組み合わせた場合に法的な問題に直面しました[4, Ch. 1]が、その時点では統計的な方法は天文学者の間で広く使用されていました。

データサイエンティストにとって、現実とのメンタルモデルの対比は、その活動の中心にあるようです。これは、A/Bテストなどの単純な例だけでなく、予測や最適化においても真実に接続する強い傾向があります。人々は、情報の断片を繋げて一貫したストーリーを作りだそうとする傾向が強く、これらの情報が実際には関連していない場合でも（いわゆる後知恵のバイアス）、そのストーリーは頭の中に入ってしまうと変化させるのは難しいです。実際、確認バイアスはその人が主にストーリーを裏付ける証拠を探す傾向があると示唆しています。予測モデルがより正確であることや、計画アルゴリズムが人間の能力を上回るパフォーマンスを発揮することを示しても、そのモデルがこの例外の部分では機能しないと主張する人々が常に現れるでしょう。もしくは、そのモデルがブラックボックスであるため信頼できないという意見もあります。私自身も最近のChatGPTの開発に関してこれを経験しました。わずか数語の指示だけで、このソフトウェアがこのブログを書ける可能性があることを受け入れるのは難しいです。これからは、ChatGPTが不正確で安全ではないか、または信頼性がないのではないかという理由を考えるだけです。自分が作成したモデルが公平な心で受け入れられるという考えは幻想です。既に存在するモデルと競争しなければならないのです、心理的にも物理的にも。

メンタルモデルを現実でテストすることについての私のお気に入りの引用の1つは、CrollとYozkovitzの著書「リーンアナリティクス」からです。

「私たちは皆妄想癖があります – 特に起業家はその中でも一番妄想家です。[…]起業家として成功するためには、誰かに無関係な良い証拠のないまま真実だと信じ込ませる必要があります。信者にあなたと共に賭けをするように説得する必要があります。自分自身に嘘をつかなくてはいけませんが、ビジネスを危険にさらさない限りです。

それがデータが役立つ場所です。」

データはメンタルモデルを現実に対して検証するための鏡として使用されます。したがって、私たちはそれをデータサイエンスと呼びます。リーの言葉によれば、科学者は「目標に忠実なモデルを選択（または作成）する」と述べています。CrollとYozkovitzの引用はまた、先行する信念に基づいてメンタルモデルを作成すること自体が悪いことではないとも強調しています。自己欺瞞は微妙な線です。一方、自分が何かをできると信じ込むことが重要な場合もあります。インポスターシンドロームもその例です。成功したことは単なる運であり、自分が詐欺として暴かれる可能性があると感じることです。そのような認知バイアスを克服するためには、「それができるまでフェイクし続ける」必要があります。一方で、多くの人々は自分の決定に対して過信しています（ダニング・クルーガー効果など）。自尊心があなたにやるべきことをやらせないか、自分がやってはいけないことをやっていることに気付けなくさせるのです。

自己欺瞞をさらに難しくするのは、ある意味で嘘ではないということです。これらの認知バイアスによって、実際にあなたのメンタルモデルが現実であると信じ込まれ、誰かが異なることを証明する任意の議論を受け入れることはありません[22, p. 490–492]。これがデータサイエンスが難しい理由です。時にはあらゆる証拠を持っていても、それが意思決定者のメンタルモデルと反対だと、その人を説得するのは困難です。いわゆる「自分の赤ちゃんは醜い」と言うのがデータサイエンティストの役割ですが、人々は普通はそれを聞かされてとても幸せではありません。

だから、これは私がデータサイエンティストであることを意味すると思っていたメンタルモデルでした、プラトンとナードによって解体されるまで。

Mt Chaberton — Claviere, Piedmont. Image by Author

現実はメンタルモデルの積み重ねです

前の段落をもう一度見ると、私が「現実」と呼んだものは、さらに別のメンタルモデルのスタックで満たされていることがわかります。『Lean Analytics』の「リーン」とは、エリック・リースの『リーン・スタートアップ』[6]というメンタルモデルを指しており、急速な成長のための素早い起業家の試行錯誤の方法を提唱しています。これにより、会社が十分に大きくなり、株式公開が可能になることを期待しています。その後、ビジネスは急速に拡大する必要があるという考え方は、シリコンバレーの指数関数的な組織の成功したビジネスモデル[7]に触発されている可能性があります（実際には全てのスタートアップの0.4%しか拡大しない[8]）。

歴史をさらに掘り下げると、企業が成長する必要があるという考えは、明らかに資本主義のものであり、18世紀のアダム・スミスなどの思想に由来しています。公共企業の概念は、17世紀のオランダ東インド会社（VOC）の発明です [9]。当時、オランダはまだ発明されたばかりの国であり、4代のブルゴーニュの支配者によって形成された歴史を持っています。もっとも興味深いのは、お金そのものの概念です。リーはセールの言葉に言及し、「お金と思われるものすべてがお金である」と述べています [10 p.78]。

6歳の子供との議論をしたことがある人は、新しい考えに至るまで、なぜという質問を続けながら心のモデルを剥ぎ取り続けることができると目撃したことがあるかもしれません。最終的には自分自身の思考の公理のような心のモデルに至るまでです。ですが問題があります。これらのモデルは、ただのモデルなのです。現実ではありません。量子力学のような基本的なモデルでさえ、大規模なスケールで考えると不正確です。

なぜデータサイエンティストはエンジニアなのか

あなたは心のモデルに囲まれていますが、そこでエンジニアが物語に入ってきます。リーは、科学者とエンジニアの違いについて書いています。

「私たちは、ターゲットに忠実なモデルを選択（または発明）するか、モデルに忠実なターゲットを選択（または発明）することができます。前者は科学者の本質です。後者はエンジニアの本質です。」 P.197.

例として、リーはトランジスタを挙げています。トランジスタはオン/オフスイッチのモデルです。つまり、トランジスタは本当はオン/オフスイッチではありません。トランジスタはただ、オン/オフスイッチに近い近似として作られています。ターゲット（トランジスタ）はモデル（オン/オフスイッチ）に忠実です。エンジニアと科学者の上記の定義に従えば、トランジスタの作成はエンジニアの仕事です。さらに、リーは、トランジスタなどの「実際の振る舞い」を説明するであろうファラデーアの法則などの電磁気学の法則も、実際にはモデルであることを示しています。現実はこれらのモデルに従う場合もあれば、はっきりと間違っている場合もあります。実際、科学は前のモデルの近似に基づくモデルのスタックのようなもののようです。これは、あるレベルの抽象化に達すると、現実はモデルに忠実ではなくなるまで続きます。リーが第2章から第6章で示しているように、コンピュータ科学のモデルのスタックは、トランジスタからウェブサイトまで、ほとんど終わりがありません。

経済モデルも同様です。次に誰かと出会ったとき、その人にペンを借りることができるか尋ねてみてください。驚くことに、ほとんどの人は料金を請求しないか、あなたにそのペンを持って行くよう主張しないでしょう。人間の相互作用の一部の文脈では、「日常の共産主義」のような形式が支配的な方法のようです [11, pp. 94-102]。

しかし、リーは、実際には私たちが科学と呼んでいるほとんどのものはエンジニアリングであると主張し続けています。

「しかし、より基本的には、タイトル『プラトンとナード』は、知識、そして技術自体が人間から独立して存在するプラトニックなアイデアからなるという概念と、人間が知識と技術を創造するという対立的な考え方を対立させます。 […] タイトルにあるナードとは、創造的な力であり、主観的であり、奇抜であり、それが既存の真理ではなく、人間が生み出すものであるということです。」

これを読んだ後、自分が間違った職業を選んでしまったのかという気持ちになりました。私にとって、データサイエンスの概念はまさに「発見」の部分でした。データに取り組んで独立した観察者として「洞察」を生み出し、それによって組織に「価値」を追加することが求められると思っていました。このコンセプトに従えば、データサイエンティストはアガサ・クリスティのポワロ探偵のような存在であり、謎を解くために証拠を見つける役割を果たしますが、殺人の計画には関与していません。そして、もちろん、謎が解かれると、オーディエンスに（データサイエンティストの場合、やや派手ではないパワーポイントのプレゼンテーションで）その解決の優れた点が示され、その解決の素晴らしさに驚きます。確かに、これは少し誇張された表現ですが、解決策が複雑であり、メガネをかけた白人男性によって発見されるべきであるという考えは、別の心のモデルの一部と言えるでしょう [12]。リーの科学者の定義に従うと、私たちのデータサイエンスのポワロは、現実に忠実なモデルを発明する人物であり、つまり科学者です。

しかし、以下の問題を考えてみてください：近い将来売上が伸びるとほぼ確信している新しい商品の歴史的な売上データ（下の図を参照）が与えられます。どのような予測を行いますか？データだけに従って線形モデルを当てはめて将来を予測しますか？それともこの情報を利用して次の数年間に指数的な成長を示すモデルを定義しますか？後者を選び、予測をしてそれをビジネスオーナーと共有します。ビジネスオーナーはその予測を実現するためにマーケティング活動を本格的に開始することを決定します。予測がビジネスの目標となり、売上が予測を上回って伸びていきます。エンジニアと科学者に関するリーの議論に従うと、これらのビジネスの結果は工夫されたものですか？それともそれらは避けられない科学の結果なのでしょうか？

この例は、マクリダキス[13]の「21世紀の計画と予測」から取られたものです。彼の本では、ビジネスオーナーに対して歴史的な売上データに基づいて予測を行うように求められます。データと共に、その製品が古いもの、新しく開発されたもの、成熟したもののいずれであるかが伝えられます。図1から明らかなように、予測は大きく異なっています。これらの予測はいずれも本質的に間違っているわけではありません。それらは製品のライフサイクルのメンタルモデルに従っています。同じデータでも、予測は完全に異なるものになり、それが結果や行動に影響を与えています。私たちのデータサイエンティストは殺人の解決者なのでしょうか、それとも加害者なのでしょうか？

現実的には、データサイエンティストとして、あなたは「価値」（モデル）の定義において重要な役割を果たします。ビジネスと議論をして、彼らがデータを通じてどのように価値を追加できるかを考えます。KPIの定義にも関与します。もし財務的な利益が見つからない場合、データ分析から得られる他の何かに利益があることがしばしばあります。成功したデータサイエンティストは、しばしば顧客の行動を変える方法（収益の最適化など）に忠実であるとされます。もちろん、現実をある程度変えることしかできません。人々の行動を変えることは難しいかもしれません。しかし、データサイエンティストとして、現実を変えることができ、おそらく既に「現実」を変えていることに気付かないのは間違いです。データサイエンティストはエンジニアです。

Fig 1., 3 Drastically different forecast based on the same data, based on Makridakis [13, p. 19]. Image by Author. — 図1、同じデータに基づく予測の予測値が大きく異なる、Makridakis [13, p. 19]に基づく画像。著者による。

現実のエンジニアリング

「まあ、ゲームのルールが悪い戦略を強制するなら、戦略を変えるのではなく、ゲーム自体を変えるべきかもしれません。」

この引用は、「生き方のアルゴリズム」[14, p. 240]という本から来ています。ゲーム理論の章では、著者たちはVickreyオークション[15]について話し合っています。Vickreyオークションは、2番目に高い入札額を支払う方式のオークションであり、各プレーヤーにとって支配的な戦略は、他のパーティに高い価格を支払わせるために嘘をつくのではなく、アイテムの価値と考える金額に真実の入札をすることです。この意味では、Vickreyオークションは好ましいモデルに真実を追求する方法の例です。

実際には、さまざまな「好ましいモデル」が存在します。モデルの共通の特徴は、例えばランダム性が少ないことです。これは「シックスシグマ」という名前で製造業と物流において、あるいは「努力のない体験」[16]として顧客サービスにおいて現れます。モデルがランダム性に対応できる場合、それを分析し、それに基づいて意思決定することが容易です。データサイエンティストの確率論的な背景が重要となります。統計モデルを使用してランダム性の一部を説明し、シミュレーションのような手法を使用してモデルが不確実性に対処する能力を確認し、ビジネスオーナーが一時的な日々のパフォーマンスに過度に焦点を当てて安定した長期的な傾向を見落としていないことを指摘することができます。リーのトランジスタとその後の抽象化の例が示すように、ランダム性を減らすことは重要です。Pythonでプログラミングをしているとき、プログラムが自分のマシン上で具体的にどのように実行されるかを考える必要はありませんし、おそらく機械語に近い言語でプログラムされていた場合よりも速くない可能性があることを当然のこととして受け入れています。

ただし、ランダム性を減らすこともリスクを伴います。多くの危機は、抽象度が低いレベルでの仮定が破られたときに発生します。物流の供給チェーンを例に取りましょう。過去10年間、シックスシグマの理念は、供給チェーンの一部を管理するための主要な戦略として取り上げられてきました。しかし、供給チェーンが長くなればなるほど、より多くのランダム性が生じることは避けられません。小さな混乱はバッファーを使用することで緩和されるかもしれませんが、これは大きな混乱の場合には当てはまりません。コロナ危機以降、大きな混乱は頻繁に発生しています[17]。その結果、研究は混乱に備える方法を見つけることにより重点を置き始め、混乱そのものを減らすことよりも重視されるようになりました[18]。ここでも、データサイエンティストはエンジニアの役割を果たします。彼/彼女は観察された分散を減らすべきものとして説明するのか、それは避けられないものとして受け入れるべきなのか？どちらかを説明することは、予測の例と同様に異なる戦略につながるでしょう：厳格なプロセス vs. 強靭なプロセス。

データサイエンティストがエンジニアであるというコンセプトは、データとAIに関する倫理的な議論でもよく見られます。顧客をより多く購入/クリック/消費するように導くことが多くは無害であるかもしれませんが、場合によってはそうではありません。シュレ（Schüll）によると、ラスベガスのスロットマシンの中毒性についての研究では、スロットマシンのエンジニアリングが中毒性にどのように寄与しているかが説明されており、これは他のデジタルデバイス（携帯電話など）にも多くの原則が当てはまるとされています。ある奇妙な例では、カジノの中で何かが発生し、救急隊が救命措置を行なっている最中も、他の訪問者はスロットマシンで遊び続けています。スロットマシンは、隣の人が床に倒れてもユーザーが「流れ」に入り続けるように最適化されています。

もちろん、スロットマシンを中毒性にするA/Bテストを実行したエンジニアに責任があるのかどうか議論することもできますが、私は少なくともこれが部分的にはその場合であると考えています。明るい面では、スロットマシンは以前と同じくらい中毒性がありますが、アルゴリズムの誤りに対するメディアの関心がアルゴリズムの公正さなどにも注意を向けるようになりました[20]。重要なパブリックアルゴリズム（例：検索エンジン）は、アルゴリズム監査[21]の対象となることがより頻繁になっています。 “測定できないものは管理できない”というスローガンの下、分析に公正さの指標を含めると、意思決定者はなぜその指標を無視したかを説明しなければなりません。公正さの指標が報告されていない場合、意思決定者は初めから公平性の問題に気付かないかもしれません。

結論

データサイエンスと分析の記述には常に分析の重点が置かれていますが、それはむしろ発明であるべきでしょうか？ Gartnerの分析的成熟度カーブでは、「記述的分析」という段階には、現象を単に分析する「記述的分析」と「予測的分析」が完了してから始めることができます。しかし、多くのアプリケーションでは、行動（実際の現象）がモデル（収益、公正性など）に合わせて調整されていることがわかる場合があります。一部のシステムやテクノロジーは、他よりもユーザーフレンドリーですが、人々が技術に適応していることは否定できません。Googleは使いやすい検索エンジンだと思いますが、適切なキーワードを探し、適切なウェブページにたどり着くためにトレーニングされたことも認識しています。私は車の発明と同様に、効率的な交通において同様に重要な役割を果たした通りを渡る前に注意を払うことを学びました。

もちろん、データサイエンティストとしては、単に現象を分析する場面もあります。ポワロの役割、つまり殺人事件の調査だけを行う場合もあります。しかし、行動がしばしば技術に追随するのではなく、逆の方向になることを知ることは、データサイエンティストにとって役立つことです。実際の現象を分析する代わりに、望ましい現象がどのようになるかを考え、それに合わせてモデルを設計することができます。

参考文献

[1] Lee, Edward Ashford, Plato and the Nerd: The Creative Partnership of Humans and Technology (2017), MIT Press

[2] Hayashi, Chikio, What is data science? Fundamental concepts and a heuristic example. Data science, classification, and related methods (1998), Springer, Tokyo, 40–51. Via Wikipedia: https://en.wikipedia.org/wiki/Data_science. Parts between brackets are from the Wikipedia page, the rest is quoted from the original paper. Last accessed: 02–04–2023.

[3] BBC、時計の歴史（2022）、You’re dead to me、BBC、取得元：https://www.bbc.co.uk/programmes/p07mdbhg、最終アクセス日02–04–2023。

[4] Stigler, Stephen M. 統計学の歴史：1900年以前の不確実性の測定。ハーバード大学出版局、1986年。

[5] Croll, Alistair、およびBenjamin Yoskovitz. リーンアナリティクス：データを使用してスタートアップをより速くより良く構築する。O’Reilly Media, Inc.、2013年。

[6] Reis、Eric. リーンスタートアップ。ニューヨーク：クラウンビジネス27（2011）：2016–2020。

[7] イスマイル、サリム。指数関数的な組織：新しい組織はあなたの組織よりも10倍優れており、より速く、より安くなっています（そして、それについて何をするべきか）。ディバージョンブックス、2014年。

[8]: ScaleUpNation. スケーリングの技術。2020年。 https://scaleupnation.com/wp-content/uploads/2021/02/The-Art-of-Scaling-3.1.pdf. 最終アクセス日：02–04–2023。

[9] VOC。取得元：https://en.wikipedia.org/wiki/Dutch_East_India_Company 最終アクセス日：02–04–2023。

[10] Searle, J. マインド、ブランド、科学。ハーバード大学出版局、ケンブリッジ、マサチューセッツ州。

[11] グライバー、デビッド。債務：最初の5000年。ペンギンUK、2012年。

[12] Chang、E. ブロトピア。ペンギン、2019年。

[13] Makridakis、Spyros。予測、計画、および21世紀の戦略。フリープレス、1990年。

[14] Christian、Brian、およびTom Griffiths。アルゴリズムは生きるためのもの：人間の意思決定のコンピュータサイエンス。マクミラン、2016年

[15] ビックリーオークション。取得元：https://en.wikipedia.org/wiki/Vickrey_auction、最終アクセス日：02–04–2023。

[16] Dixon、Matthew、Nick Toman Rick DeLisi、およびN. Toman。エフォートレスエクスペリエンス。ペンギンランダムハウス、2020年。

[17] 国会調査局。供給の中断と米国経済。2022年。取得元：https://crsreports.congress.gov/product/pdf/IN/IN11926、最終アクセス日：02–04–2023。

[18] Spieske、Alexander、およびHendrik Birkel。COVID-19パンデミックの印象の下での産業4.0を通じたサプライチェーンの弾力性の向上：体系的文献レビュー。コンピュータ＆インダストリアルエンジニアリング158、2021年。

[19] Schüll、Natasha Dow. デザインによる中毒。プリンストン大学出版局、2012年。

[20] Pitoura、Evaggelia、Kostas Stefanidis、およびGeorgia Koutrika. ランキングと推奨の公正さ：概要。The VLDB Journal、ページ1–28。スプリンガー、2022年。

[21] Bandy、Jack。問題のある機械の振る舞い：アルゴリズムの監査の体系的文献レビュー。proceedings of the acm on human-computer interaction 5、CSCW1、ページ：1–34、ACM 2021年。

[22] Pinker、Steven。我々の本能のより優れた天使：歴史的な暴力の衰退とその原因。Penguin uk、2011年。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Data scienceMental Models

Was this article helpful?

93 out of 132 found this helpful