「VoAGI創設者グレゴリー・ピアテツキーシャピロとの30周年記念インタビュー」

30th Anniversary Interview with VoAGI Founder Gregory Piatetsky-Shapiro

 

VoAGIの記念日おめでとうございます!

このウェブサイト、現在お読みいただいているものは、30年前に控えめなニュースレターとして始まり、その後、現在も続く最も古く、最も長く続くデータサイエンスのリソースの1つに変貌しました。私たちはこの偉業を1か月間にわたって祝っています。まずはVoAGIの創設者であるグレゴリー・ピエテツキー・シャピロ氏との最近のディスカッションを共有することから始めます。

グレゴリーはVoAGIの立案者であり、最近まで28年以上にわたってこのサイトを運営していました。データマイニングと知識発見の分野の研究者をつなぐために、彼は1993年にKnowledge Discovery Nuggets(VoAGI)ニュースレターを立ち上げました。2022年までの引退まで、グレゴリーの指導のもとで、VoAGIはデータサイエンス、機械学習、AI、分析の分野で影響力のある出版物に成長しました。

彼は楽しい引退生活を送っていますが、私たちは彼を広範なディスカッションに誘い戻すことができました。VoAGIの歴史、現在の状況、将来、そして思い出話についても話しました。

このインタビューの質問は、VoAGIの編集者であるマシュー・メイヨ、アビド・アリ・アワン、ニシャ・アーヤによって行われました。各質問の編集者は途中で注釈されています。

VoAGI: グレゴリー、30周年おめでとうございます!あなたが誰であるか知らない数少ない人々のために、30,000フィートの短縮版を教えていただけますか?(マシューによる質問)

グレゴリー: マット、ありがとう。再びVoAGIと一緒に働けて嬉しいです。

私はおそらくVoAGIの創設者として最も知られています。また、データサイエンスとデータマイニングの主要なカンファレンスであるKDDカンファレンスの共同創設者でもあります。私の科学的なキャリアは、AIとデータベースの研究者として始まりました。1984年の博士論文は、自己組織化データベースシステムに関するものでした。その後、ボストン地域のGTEラボで約12年間、AIとデータベースの交差点で応用システムを研究し、構築しました。1989年に私たちは「データベースでの知識発見」という世界で初めてのプロジェクトを開始しました。私たちのプロジェクトは、医療(KEFIRシステム)、詐欺検知、離反(顧客離脱)予測などに興味深い応用を生み出しました。

1997年、ドットコムブームが初期段階にあり、私はGTEを退職し、金融分野へのデータマイニングの応用を行っているスタートアップに参加しました。私たちは世界最大の銀行や保険会社と協力し、顧客セグメンテーション、離反予測、クロスセルなどのモデルを開発しました。2000年、最初のスタートアップは5000万ドルで大型スタートアップに買収されましたが、私たちの株式オプションを現金化する前に、ドットコムバブルが崩壊し、2番目のスタートアップも倒産しました。辛くも得た株式オプションの価値はゼロでした。

グレゴリー・ピエテツキー・シャピロ氏は、「データベースでの知識発見」という用語を最初のワークショップ(KDD-1989)のために作り出し、この用語はAIと機械学習のコミュニティでより人気がありました。しかし、ビジネスと報道のコミュニティでは、「データマイニング」という用語がより一般的に使われるようになりました。現在は、「データマイニング」と「知識発見」という用語が同義で使われています。-「データマイニング」ウィキペディアエントリー

そのため、2001年に私は独立し、VoAGIを発行し、コンサルティングを行うことにしました。

私はさまざまな興味深いコンサルティングプロジェクトを行ってきました。アルツハイマー病のバイオマーカーの検索、eBayでの偽造ジュエリーの検出、ソフトウェアの使用状況の分析などです。しかし、VoAGIがより人気を集めるにつれて、より多くの時間が必要となり、コンサルティングをやめ、VoAGIに専念することにしました。

2012年頃からデータサイエンスと機械学習が注目されるようになり(「21世紀の最も魅力的な仕事、データサイエンティスト」という記事などで証明されています)、VoAGIは大幅に成長し、業界で広く認識されるようになりました。VoAGIは、AI、ビッグデータ、データサイエンス、機械学習のトップ出版物の中で頻繁に名前が挙げられていました。

2018年には、私はLinkedInのデータサイエンスと分析のトップボイスに選ばれるという光栄を受けました。

もちろん、私がVoAGIで達成した成功は、私と一緒に助けてくれた多くの他の人々と共有しています。全員を挙げることはできませんが、特にGTEで初期のVoAGIウェブサイトで私と一緒に働いてくれたクリス・マテウスとマイケル・ベドウズを特に挙げたいと思います。KDDカンファレンスと組織で一緒に働いたウサマ・ファヤード、サム・ウスラマミ、ウォン・キム、そして2013年から2015年にVoAGIを手伝ってくれたアンモル・ラジプロヒットも忘れてはいけません。

最後に、そして最も重要なのは、Matthew Mayoです。彼は2016年にVoAGIチームに参加し、VoAGIが現在の成功に達するのを助け、私が2022年に引退した際に引き継ぎました。

   

パブリケーションを始めるきっかけについて教えていただけますか?(ニシャ)

1989年に、私はIJCAI-89で最初のデータベースにおける知識発見に関するワークショップを開催しました。そのワークショップは1991年と1993年にも繰り返され、1993年の7月には、この分野で研究している研究者をつなげるために、私はニュースレターを始めました。その時私はそれを「Knowledge Discovery Nuggets」と呼んでいました。当時の「データマイニング」という用語は曖昧であったため、「知識発見」という用語を使用しました。私たちが何を採掘しているのかはっきりしていませんでした。「Nuggets」というのは、主に短くて関連性のある興味深いアイテムを発行していました。データの鉱石に見られる「金の塊」をイメージしてください。

このワークショップは、1995年にKDD-95としての会議に発展しました(Usama FayyadとSam Ramaswamyが主催)。そして、KDDの会議は、世界でも最も重要なデータサイエンスの会議として今も続いています。私は2005年から2009年までACM KDDの組織の議長を務め、2013年までKDDの執行委員会に所属していました。

VoAGIの最初の号は、KDD-93ワークショップに参加した約50人の研究者に送られました。この分野の情報量は増え続けており、ワークショップの主催者として、それを集めて整理することができました。1994年、World Wide Webの登場後すぐに、データマイニングと知識発見に関する世界で2番目のサイトを開始しました。それは「Knowledge Discovery Mine」と呼ばれていましたが、GTE Labsのドメインに存在し、現在は利用できなくなっています。

1997年にGTE Labsを離れた際に、私はその情報をVoAGIという新しいウェブサイトにコピーしました。これはKnowledge Discovery Nuggetsの略称です。このウェブサイトは今も存在しています…そして、あなたがそれを読んでいるのです!

  VoAGIで目標を達成したと感じていますか?(ニシャ)

目標は旅です!

ただし、VoAGIの成功と長寿は私の期待をはるかに超えています。

VoAGIニュースレターを作成する際の最初の目標は、1年に1度のワークショップよりも頻繁にこの分野で働く研究者をつなげることでした。最初のVoAGIに関連するウェブサイトの目標は、1994年にGTE Labsで作成されたもので、主にデータマイニングに関する既存の情報、主にソフトウェアとデータセットを整理し、すべてに利用可能にすることでした。これら2つのセクション、ソフトウェアとデータセット、は何年もの間、最も人気のあるセクションでした。

1990年代には、VoAGIは非常に包括的なソフトウェア、データセット、会議、および他の関連情報のディレクトリを持っていたため、非常に有用なリソースでした。

分野が成長するにつれて、データマイニングとデータサイエンスに関連するものの手動で管理されたディレクトリを維持することは不可能となり、VoAGIは実践的で教育的なコンテンツに焦点を当て、実務家に役立つ情報により重点を置くようになりました。また、興味が2010年代と2020年代に劇的に高まったタイミングも幸運でした。その結果、購読者数とウェブサイトの訪問者数が大幅に増加しました。

  VoAGIがデータ分野にポジティブな影響を与えたと感じていますか?(アビド)

私は確かにそう願っています!初期の段階では、VoAGIニュースレターやウェブサイトは、研究コミュニティをつなげるための有用なリソースであり、後にはキャリアの初期段階にある実務家やデータサイエンティストにとって有用な教育リソースとなりました。

私たちの読者の中には、次の漫画で示されているように、VoAGIを本当に楽しんでいる人々もいました:

   

あなたの出版キャリアの中で最も大きな進歩と感じるデータサイエンスの進展は何ですか?(マット)

明らかに、ディープラーニングです。ニューラルネットワークの研究は1960年代から行われていましたが、ディープラーニングの手法が主に2000年代初頭にジェフ・ヒントン、ヤン・ルカン、ヨシュア・ベンジオによって開発されました。ディープラーニングの最初の注目すべき成功は、ジェフ・ヒントンと彼の学生によって作成されたAlexNetが2012年10月に行われたImageNetコンテストで前例のない大きな差で優勝したこととされています。

その後すぐに、多くの研究者や実践者がディープラーニングを使用し始め、VoAGIはそれをカバーし始めました。ディープラーニングは、すでに2012年12月のVoAGIのトップニュースでした。

ディープラーニングやChatGPTなど、それに由来する後の技術は、現在でも最も人気のあるトピックの一部です。

VoAGIに取り組む上で、あなたにとって重要だったことは何でしたか?(例:お金、経験、知識の普及など)(アビド)

もちろん、お金は重要でした。2001年以来、私は自営業であり、家族を支え、住宅ローンを支払わなければなりませんでしたが、それが最も重要なことではありませんでした。おそらく、VoAGIを始めたときの私の主な動機は、コミュニティの構築と優れた人々との交流でした。1993年から2000年まで、私はVoAGIのニュースレターとウェブサイトを、収益や広告なしで、純粋なボランティア活動としてコミュニティのために運営していました。VoAGIの運営は、KDDのワークショップやカンファレンスの組織を手伝うことと、報酬はありませんが非常にやりがいのあるボランティア活動の自然な補完でした。

私は、非常に多くの訪問者と購読者から判断されるように、VoAGIがデータマイニングとデータサイエンスの知識の普及において肯定的な役割を果たしたと考えています。

競争の激しいメディアの中で、VoAGIが際立つようにどのようにしましたか?(ニシャ)

魔法の公式はありません。それにはまず第一に、多くの努力が必要でした。しかし、VoAGIの持続的な成功の「要点」を見つけるなら、それは品質の高いコンテンツ、シナジー、そして注目です。

まず、私たちは良質なコンテンツを見つけるか書くことに努めました。次に、異なるチャネル間のポジティブなシナジーに頼りました。メールはサイトへの訪問者を増やすのに役立ち、サイトはさらにメールの購読者を増やすのに役立ちました。VoAGIはTwitter(現在のX)、LinkedIn、Facebookでも成功を収め、お互いを補完していました。

最後に、注目です。私はサイトの内部の動作に非常に注意を払い、重要な指標を改善するために定期的に修正し、外部のトレンドにも注意を払い、フィールドで興味深くホットな内容に私たちのコンテンツを適応させました。

VoAGIが初期にカバーした特に影響力のあるまたは記憶に残るストーリーと、それがもたらした効果を共有できますか?(ニシャ)

1990年代の初期のストーリーの一つは、里子の子供たちに関するものでした。VoAGIが行った有用なことの一つは、研究者からの問い合わせを投稿することでした。1995年ごろ、一人の人が里子の子供たちの支払いデータベースの問題に取り組んでいるという問い合わせを投稿しました。名前が微妙に異なる状況が多くあり、正しい人物に支払いを行うためには、異なる綴りを統一する必要がありました。別の研究者がVoAGIでその問い合わせを見て、名前の一致を解決するために彼らのアルゴリズムを適用できました。これにより、より多くの子供たちに支払いが行われ、彼らの生活が改善されました。

あなたが離れていても、VoAGIを将来の10年間でどこに見たいですか?(ニシャ)

私は、まだ人間によって書かれたコンテンツがあり、人間の読者がいることを願っています!

AIが最終的にコンテンツ作成を引き継ぐことについてどのように感じていますか?(アビド)

一方で、子供の頃に読んでいたAIやロボットに関するSFの物語が現実に近づいていること、そして一部の場合には現実がSFを超えていることに非常に興奮しています。一方で、人間のコンテンツクリエイターに対しては悲しい気持ちもあります。

ソーシャルネットワークは既に注目を最適化する危険性を示しており、AIは非常に優れた最適化ができます。数年後(または数カ月後)には、AIが中毒性のあるコンテンツを作成し、多くの人がそれをノンストップで見たくなることが想像できます。

おそらくAIはすでにTikTokで多くのコンテンツを生成しているのかもしれません。

しかし、社会にとってそれほど多くの人々がデジタルドラッグに中毒することは良いことなのでしょうか?

AIの約束と脅威は、もちろんコンテンツ作成に限られません。AIは潜在的にほとんどの仕事を引き継ぐことができます。

短期的には、人間+AIが人間やAI単独よりも多くのタスクで優れた成果を上げることができる共同作業の期間があると思います。チェスを例に取ると、Deep Blueが1997年に世界チャンピオンのガリー・カスパロフを破った後、人間+コンピュータのチームがコンピュータや人間よりも優れた成績を収めるトーナメントがありました。しかし、その期間は短く、現在、最高のチェスプログラムは世界チャンピオンさえも遥かに優れています。

長期的には、AIによる失業の増加と所得格差の拡大に非常に懸念しており、これは社会を不安定化させ、民主主義を破壊する可能性があります。それは今年では起こりませんが、現在の技術のトレンドはそのようなシナリオに向かっています。AIによる失業の長期的な解決策として、ある種の基本的所得形態や人間の創造性の開発に重点を置くことが考えられます。

このような解決策は採用が困難であり、政治的な活動と市民の関与が必要となります。ですので、AIのリスクについて懸念を抱いている読者の方々は、それについて学び、関与し、投票するようお願いします!

  グレゴリー、ありがとうございます!あなたの参加は大切です。VoAGIにとってこのようなマイルストーンを祝うことは、それがなければ同じではありません。

    Matthew Mayo (@mattmayo13)は、コンピュータサイエンスの修士号とデータマイニングの研究科学位を保持しています。VoAGIの編集長として、Matthewは複雑なデータサイエンスの概念をわかりやすくすることを目指しています。彼の専門的な関心は、自然言語処理、機械学習アルゴリズム、新興のAIの探求にあります。彼はデータサイエンスコミュニティで知識を民主化するという使命によって駆り立てられています。Matthewは6歳の時からコーディングを始めました。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

NVIDIA H100 GPUがMLPerfベンチマークのデビューで生成型AIの標準を設定

主要のユーザーと業界標準のベンチマークによれば、NVIDIAのH100 Tensor Core GPUは特に生成型AIを駆動する大規模言語モデル...

機械学習

SalesforceはXGen-7Bを導入:1.5Tトークンのために8Kシーケンス長でトレーニングされた新しい7B LLMを紹介します

最近の人工知能の技術的なブレークスルーにより、Large Language Models(LLMs)はますます一般的になっています。過去数年間...

AI研究

CMUの研究者が「Zeno」という名前の、機械学習(ML)モデルの行動評価のためのフレームワークを紹介しました

AI駆動システムのプロトタイピングは常に複雑でした。しかし、プロトタイプを使用してしばらくすると、それがより機能的であ...

機械学習

AIハイパーソナライゼーションとは何ですか?利点、事例、倫理的懸念

AIのハイパーカスタマイズの概念、メカニズム、および事例について探求してくださいその利点と倫理的な問題について学びましょう

データサイエンス

「LLMsを使用したモバイルアプリの音声と自然言語の入力」

この記事では、GPT-4の関数呼び出しを使用してアプリに高度な柔軟性のある音声理解を実現する方法について学びますこれにより...