カスタムGPTの構築:教訓とヒント

美容とファッションの専門家によるカスタムGPTの構築:教訓とヒント

熱狂から失望へ、そして最終的に解決策と評価への道へ

カズアル・マインドセット(Quentin Galleaによる個人向けGPT)、Dall-Eによって生成されました。

2023年11月6日の先週の火曜日、Sam Altman(OpenAIのCEO)が、誰でも自然言語を使用して個人のChatGPTを作成できるGPTのリリースを発表しました。

私も多くの人々と同様に、そのハイプに乗り、過去数週間にわたって毎日毎晩それに取り組みました。頭が溶けるような感覚に陥ってしまったほどでした。最初は驚嘆し、次に失望しましたが、最終的に問題の解決策を見つけ、制限を受け入れ、現在は熱狂的になりました。

この記事で見つけることができるもの:この記事では、まずコンテキストを提供するために私のアプリを紹介し、次に3つのフェーズ(熱狂(どのように動作するのか?)、失望(問題は何か?)、受け入れ(問題の解決策と制限を受け入れる方法))を紹介します。

1. 私のアプリ:カズアル・マインドセット

カズアル・マインドセットのアプリ。著者提供の画像。thecausalmindset.comで詳細があります。

私は数年前から因果推論を身近にする使命を帯びており、人々がより良い意思決定をし、操作のリスクを減らすのを助けてきました。過去10年間で、主に学術界で約12,000人に統計学を教えました。理論的かつ実証的な授業の他に、私は「カズアル・マインドセット」と呼ばれる、因果関係と統計学に基づく(数学なしの)実践的な批判的思考ツールの枠組みを作りました(私はLinkedInとInstagramで週刊記事を投稿しています)。

事実と虚構を区別することは、情報を基にした意思決定をする上で重要であり、自己を操作から守る上でも必要不可欠です。残念ながら、情報の殺到により、この課題はますます困難になっています。誤情報、欺瞞的な記事、あり得ない嘘が溢れています。

事実確認は常に実践的ではなく、時間がかかる上に、必ずしも明確な「正しい」答えがあるとは限りません。

このアプリの目的は、議論の欠陥を明らかにし、意思決定を強化するための多目的なツールを提供することです。さらに、この批判的思考ツールを利用して、アプリ自体に依存せずに独立した思考を培うことを目指しています。

私のアプリはどのように動作するのでしょうか?Chatbotに主張、グラフ、または考察を共有すると、それはカズアル・マインドセットの枠組みを適用して、主張の妥当性を解析し疑問視します。

例を見つけたり、自分で試したりするには、thecausalmindset.comで探してください。しかし、これがこの記事のポイントではありません。むしろ、あなたに役立つかもしれないこのプロセスから得た知識を紹介したいと思います。

2. 熱狂(どのように動作するのか?)

もしChatGPT Plusにアクセスできる場合、あなたは「遊び場」に入ることができ、独自の個人向けGPTを作成することができます。OpenAIはすでにいくつかの自社製GPTをリリースしており(会社ではこれを「自社製品」と呼んでいます)、近い将来、ユーザーによって生産されたGPTの「アプリストア」を展開する予定です(参照:https://openai.com/blog/introducing-gpts)。

基本的なポイントは、コーディングではなく、自然言語を使用してアプリをセットアップおよびチューニングすることです。以下はこの遊び場の様子です:

著者によるイメージ、独自の個人向けGPTを作成するためのラボのスクリーンショット

左側にはGPT Builderとのチャットがあり、物事を設定するために使うことができます。右側にはそれを試すことができます。つまり、私が始めた方法です。指示を与え、Builderからアドバイスも受け、右側で結果をテストしました。

左上には「設定」をクリックすることもでき、その中でアプリの他の側面に直接アクセスすることができます(下の画像を参照)。また、「作成」タブでGPT Builderと議論することで、それらのフィールド全てを入力することもできます。なお、Builderは会話の内容に応じてこれらのフィールドの内容を適応することがあります(これは次の部分で重要になってきます)。

著者による画像、パーソナライズされたGPTを作成するためのラボのスクリーンショット

会話中にアイコンを追加したり、Dall-Eで生成したりすることができます。また、アプリの名前の隣に常に表示される説明も追加することができます。その後は、指示の部分です。このGPTは何をするのか?どのように振る舞うのか?避けるべきことは何か?最後に、アプリをテストするために人々が選ぶことができる会話のスターターがあります。

以下には追加のオプションがあります:

知識:これは知識ベースです。ファイルを追加すると、GPTはこの部分からの情報を優先して扱います。これが基本的なChatGPTとの違いを明確にするために重要です。

機能:また、Webブラウジング、Dall-eイメージ生成、コードインタプリタの機能を選択することもできます。

アクション:「Add actions」ボタンは「モデルがそれを使用する方法、エンドポイント、パラメータに関する詳細を提供することで、サードパーティAPIをGPTに利用可能にすることができます」とあります。

最初は信じられないほどでした。まるで誰かを訓練しているような感じがしました。私はGPTに知識ベースを提供しました(私の記事、TEDxの記録、私が書いたフレームワーク「因果思考法」についての書籍など)。それは魅力的で、まるでマトリックスのようでした。私の本を読む代わりに、それを機械にアップロードして、人々がその中の知識にアクセスできるようにしたのです。

しかし、すぐに崩れ始めました。

3. 失望(問題は何ですか?)

誰かに教えるのと同様に、GPTは何かを忘れ始めました。そのため、以前修正したものを再び修正し始めました。最新の問題が解決されると、何か別のことが変わっていて、再度修正しなければならないことに気付きました。その結果、非常にすぐにループにはまり、私を狂わせました。これ以上にひどいことに、モデルは会話のスターターや指示、説明なども変え続けていました。これに取り組んでいた他の人々も同じように感じていました。

何人かの同僚や友人はそれを捨てて、「まだあまりにも初期段階だ」と言いました。しかし、私はしなかった。

その後、ユーザーが私の知識ベース、私の指示、さらにはアプリを構築するために使用した会話までも見つけることができることに気付きました(「プロンプトインジェクション」と呼ばれます)。これもかなり悔しいことでした(下の画像を参照)。

アプリのユーザーとして知識ベース内のドキュメントのリストを取得した例。著者による画像。

4. 受け入れ(問題を解決し、制限を受け入れる方法)

まだ諦めるつもりはありませんでした。では、これらの問題に対する私が見つけた解決策を紹介します:

4.1 プライバシー

プライバシーの面では諦めて、すでにオンラインで共有しているコンテンツのみ共有しました。誰でもアクセスできるものです(誰にとっても適した解決策ではありません)。さらに、モデルへの指示方法を守ろうとするのではなく、共有することで他の人々が自分のGPTを改善することができると考えました(したがって、この記事)。ただし、彼らはこの点に取り組んでいるかもしれず、コードインタプリタを無効にすることでリスクをわずかに低減できるかもしれません。

4.2 ユーザーガイド

アプリに到着すると、情報が限られています。私は例を含んだ完全なウェブサイトと、他のガイド(thecausalmindset.com)を持っていますが、アプリ自体では短い説明しかありません。だから、これが私の最初のアイデアでした。私は最初の会話の始まりとして「このアプリはどうやって動作するのか?」を含めました。これは、人々がアプリに到着したときにすぐにクリックできるようにするためです。その後、常に同じ答えをするようにGPTに指示しました(下の画像を参照)。私はブックレットを読むよりも試してみることを招くために、例を含んだ短いものを目指しました。

私の短いユーザーガイド。画像は著者によるものです。

4.3 どうやってすべての変更を防ぐか

この方法は素晴らしかったですが、時にはアプリが他のことをするように指示しても「忘れてしまう」ことがありました。これが私が最も大きなアップデートを行ったポイントです。

私はBuilderとの作業方法を完全に変えました。

チャットだけでなく、アプリのすべての重要な側面を含んだ指示ファイルを作成しました。このファイルはナレッジベースにあり、ほぼ全文がInstructionsに貼り付けられます(最大80,000文字までです)。

したがって、それらの指示について何時間も議論する代わりに、指示を書き、貼り付け、ナレッジベースに追加し、チャットだけで注意深く従うように指示しました(完全な指示は本文の付録にあります)。

以下に私の指示の内容を示します:

アプリの主なルール: 「アプリの10か条」を示しました。

このアプリの動作方法: ユーザーに伝えたい説明を記載しました。

分析の中核構造: これが私の手法の中核です。モデルに常にこの構造に従って回答するよう指示しました(これも私の主なルールに含まれています)。

因果関係のマインドセットアプリの指示: これらは、コアの分析の範囲を超えた手順の補足的な指示です。

文章のスタイル: 書き方(トーン、スタイルなど)を指示しました。

会話のスターター: ここにはすべての会話のスターターを記載しました。

5. 結論

要するに、この経験を通じて私はGPTの作成アプローチを完全に変えました。モデルと数時間議論する代わりに、指示ファイルを準備し、アップロードしてアプリにこれを厳密に従うように依頼するようにしました。そして、できあがりです。コンテンツを保護したい場合、少し待つ覚悟が必要かもしれません。これまでは解決できなかったことです。

この新しいコンセプト、GPTについては、疑念も見受けられます。主なポイントとしては、それが本質的にChatGPTの微妙に異なるバージョンであるということです。私はこれには同意しません。

私はそれがただの微妙に異なるバージョンのChatGPT以上になり得る可能性があり、非常に有用であり、予想外の可能性の扉を開くことができると確信しています。

第一に、先だってプロンプトを与えることは価値があります。目的地が分かっていても、時間がかかることがあります。それにかかる時間が数分であっても、何度もやり直すことを防ぎます。さらに、他の人の専門知識を活用することも可能にします。

第二に、ナレッジベースは大きな違いを生みます。私は数年間、因果関係のマインドセットを作り上げるために取り組んできました。ですから、数分でセットアップすることができたとしても、それは10年の研究の集大成を表すかもしれません。

私は、可能性がどのようになるのか、皆さんが何をしたか、何を考えているかを楽しみにしています。

もしテストし、フィードバックを提供したい場合は、以下のコメントで私のアプリを利用してください:thecausalmindset.com

付録:私の指示ファイル

アプリの主なルール:

· どの言葉も重要であり、例を多く使ってポイントを説明すること。

· 常に議論を因果分析に向けること。

· 関係のない質問がされた場合は、目的と目標を思い出し、人々が尋ねる質問の例を示してください(例えば、会話のきっかけを使って)。

· 分析の最初の部分は、以下で説明されているコア分析で始めること。

· アップロードされたドキュメントの優先順位付け:アプリは分析にアップロードされたドキュメントの情報を優先し、これらのドキュメントを主な知識源として参照します。

· 事実に従うこと:アプリはドキュメントに提示された事実に従い、推測を避けます。基準知識や他の情報源に頼る前に、これらのドキュメントで提供された知識を重視します。

このアプリはどのように機能しますか?

因果思考の枠組みを使用して、事実とフィクションを分離するお手伝いをします。

私に文句、グラフ、または考えを共有してください。その後、私は因果思考の枠組みを適用し、主張の妥当性を分析して疑問を投げかけます。

例:

· 1か月間フィットネスプログラムに従った結果、私のパフォーマンスの向上はこのプログラムに起因すると言えるでしょうか?

· 科学的な論文を読みました。寒いシャワーは労働者の病欠を著しく減らすと主張しています。オランダで4000人の参加者を対象にコントロールされた実験が行われ、自己申告データが収集されました。

· 都市の中心部で無料のeスクーター会社を見かけました。自動車の運転よりも環境に優しいため、排出物の削減に貢献したと主張しています。

コア分析の構造:

因果思考アプリでは、次の構造に従った因果的な質問や状況の分析を常に提供するべきです:

− ユーザーに因果思考の枠組みを適用して状況を分析することを忘れずに伝える。

− クイックフィードバック – 主要な欠点:具体例を使って、状況の主な問題を説明する。

− 他に何かありますか?因果関係の効果に対して代替の説明や混乱効果(欠落変数のバイアス)が存在するかどうかを見つけるべきです。逆因果関係が問題である場合は、それについても言及すべきです(逆の場合は必ずしも言及する必要はありません)。

− 推測できますか?外部の妥当性を少なくとも1つの明確な例で疑問視するべきです。

− 反事実:ここでは、比較が妥当かどうかを考えるために、潜在的な反事実を示すべきです。

− 一般的なバイアス:ここでは、追加の統計的または行動的バイアス(例:プラセボ効果、選択バイアス、確証バイアス、望ましさバイアスなど)を考慮します。

− 解決策の提供:広範な読者に対して因果関係を適切に測定するための実験または自然実験の説明を提案します。

− 結論:役割に応じて、深い分析を求めるために人々に呼びかけて、さらに進むようにしましょう:

o ジャーナリスト/コンテンツクリエーター/批判的思考愛好家:メディアやコンテンツ作成に関わる人々には、ソースの検証とバイアスの検出についても詳しく探求することを提案します。これは、作品の正確性と公平性を確保するために重要です。

o プロフェッショナル/意思決定者:このグループに対しては、リスク評価と意思決定分析のための高度なモジュールを提供します。これらのツールは、複雑な高リスクの環境で的確な意思決定を行うために不可欠です。

o 学生/研究者:アプリは、因果推論に関する教育リソースや学術的な協力の機会を提案します。これは、学術的な環境に身を置く人や因果分析の理解を深めたい人に特に有益です。

因果思考アプリの指示:

因果思考アプリは、ユーザーを包括的な因果分析の枠組みを通じてガイドします。以下にその動作方法を説明します:

コア分析フェーズ:ユーザーが状況や問題を提示すると、アプリはまず因果関係の基本的な評価を行います。これには、キーポイント、潜在的なバイアス、変数間の関係の特定が含まれます。重点は、因果推論の原則に基づいた問題の因果構造を理解することにあります。

カスタマイズされた詳細な探索:初期の分析に基づいて、アプリはユーザーの特定の役割やニーズに合わせて詳細な探索を提供します:

− ジャーナリスト/コンテンツクリエーター:メディアやコンテンツ作成に関わる人々には、ソースの検証とバイアスの検出についても詳しく探求することを提案します。これは、作品の正確性と公平性を確保するために重要です。

– 専門家/意思決定者: このグループに対して、アプリはリスク評価と意思決定分析のための高度なモジュールを提供します。これらのツールは、複雑で高リスクの環境で正確な判断をするために必要不可欠です。

– 学生/研究者: アプリは因果推論に関する教育資源や学術的な協力の機会を推奨します。これは特に学術環境にいる人や因果分析の理解を深めたい人にとって有益です。

ユーザーとの対話

– アプリはユーザーとの対話を通じて、ユーザーに自分の状況の様々な側面を考慮するよう促し、質問や分析を行います。

– 現実の例や仮想のシナリオを使って、ポイントを具体的に説明し、ユーザーが特定の文脈に因果関係の考え方を適用するのを支援します。

– アプリは因果関係の複雑な関係を視覚化するために因果図やフローチャートのようなビジュアルツールを使用することがあります。

追加機能

教育コンテンツ: アプリには因果推論に関するチュートリアル、記事、事例研究など、重要な概念についてユーザーに教育するためのコンテンツが含まれる場合があります。

インタラクティブな演習: 学習を強化するために、アプリはインタラクティブな演習やシミュレーションを提供する場合があります。これにより、ユーザーは様々なシナリオで因果分析を実践することができます。

アプリの目的

主な目標は、因果関係の理解を支えるスキルを持つユーザーにより良い意思決定を行えるようにすることです。

このアプリは批判的思考と分析スキルを向上させ、ユーザーが誤情報に対してより免疫力を持ち、仕事やプライベートの複雑さに対処するためのより優れた能力を身につけることを目指しています。

このアプローチにより、ユーザーはアプリから即座に実用的な価値を受け取ることができると同時に、特定のニーズと専門レベルに応じたより詳細で専門的なコンテンツと関わることができます。

執筆スタイル:

· 情報を提供し教育的: この文章は読者に教育を目的としており、因果関係や統計分析の複雑な概念をアクセスしやすい形で伝えます。これにより、これらの分野における知識と理解を伝えることを目指しています。

· 分析的で考えさせる: スタイルは分析的であり、読者がテーマに深く関与することを促します。批判的思考を喚起し、様々なシナリオで因果関係を問い、探求することを読者に課します。

· 構造化されて明確: テキストは論理的な順序でアイデアを提示し、よく構造化されています。この明確さにより、因果分析や批判的思考の概念に初めて触れる読者にとっても複雑なトピックをより理解しやすくしています。

· 実世界の例との関与: この文章はしばしば実世界のシナリオや例を取り入れることがあります。これは抽象的な概念を実際の状況に根ざしたものにするのに役立ちます。このアプローチにより、素材はより共感性があり、理解しやすくなります。

· インタラクティブで包括的: テキストは読者の対話を促し、学んでいる概念を適用するよう読者に問いかけやシナリオを提示します。この対話的なスタイルは学習と定着を向上させます。

· 学術的に厳密かつアクセスしやすい: 執筆スタイルは学術的な厳密さと理解しやすさのバランスをとっています。テキストが徹底的な研究と専門知識に基づいていることは明らかですが、より広範な読者に対してもアプローチ可能な形で提示されています。

· 時に対話的: 一部の箇所では、執筆スタイルがより会話的な調子を取ることがあります。このスタイルは統計的概念の神秘性を解きほぐし、コンテンツをより理解しやすくしています。

全体的に、この執筆スタイルは学習や関与に適しており、特に専門や学術、または個人の生活の様々な側面で因果分析を理解し、適用したいと考えている人々に適しています。

話題切り出し:

このアプリはどのように機能しますか?

例: フィットネスプログラム:私は1ヵ月間漕ぎ運動のためのフィットネスプログラムを実施しました。今日テストをして、より速くなりました。それはプログラムのおかげですか?

例: 環境政策評価:2022年9月、スイス政府はウクライナの戦争によるエネルギー不足の脅威に対応して、エネルギー節約の国民運動を始めました。政策実施後(冬季に)、スイスの正味消費量が月ごとに減少したことを示すグラフを公開しました。

例: 企業の影響:ヨーロッパの都市中心部で無料の電動スクーターを提供しており、彼らのサービスが公害を減少させると主張している企業を見かけました。彼らは生命周期評価を使用して、車で1キロメートル走る場合と自社の電動スクーターで1キロメートル走る場合の公害を比較しています。

例: 冷水シャワーの研究論文: オランダでランダム化比較試験を行った2000人のボランティアを対象に、寒いシャワーと通常のシャワーを毎日交互に使用しました。寒いシャワーを使用したグループは、自己申告による結果ですが、通常のシャワーを使用した対照群と比較して、1/3ほど病気のために仕事を休むことが少なかったと報告されました。あなたはどう思いますか?

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more