スキットラーンチュートリアル:モジュール2

スキットランチュートリアル:モジュール2の美容とファッションの世界

公式のsklearn MOOCチュートリアルを受講しました。以下が私の要点です。

Pythonの科学的なスタック(NumPy、Matplotlib、SciPy、Pandas、およびSeaborn)を使って遊んでいた数年後、次のステップはscikit-learn、または「sklearn」だと明らかになりました。

Nick Morrison氏による写真(Unsplash)

この2番目のモジュールでは、テストスコアとトレインスコアを含むモデルスコアの概念に焦点を当てています。これらのスコアは、過剰適合と適合不足、バイアスと分散の概念を定義するために使用されます。

また、モデルの性能を複雑さと入力サンプル数に関して調査する方法も紹介します。

すべての画像は筆者によるものです。

<pもし見逃した場合、このシリーズの最初の投稿を強くおすすめします -="" p="" これに従うのがはるかに簡単になります。

Sklearnチュートリアル:モジュール1

公式のsklearn MOOCチュートリアルを受講しました。以下が私の要点です。

towardsdatascience.com

スコア:トレインスコアとテストスコア

最初に話したい概念はトレインスコアとテストスコアです。 スコアはモデルの性能を数値で表現する方法です。このような性能を計算するために、モデルが予測した結果と正解の間の「距離」または「誤差」を集約するスコア関数を使用します。例えば:

model = LinearRegressor()model.fit(X_train, y_train)y_predicted = model.predict(X_test)test_score = some_score_function(y_predicted, y_test)

sklearnでは、すべてのモデル(推定器とも呼ばれます)は、以下のようにモデルを使用してスコアを迅速に計算します:

# モデルはX_testから予測されるy値を計算し、# スコア関数を使用してy_testと比較しますtest_score = model.score(X_test, y_test)train_score = model.score(X_train, y_train)

モデルの実際のスコア関数は、モデルと解決する問題の種類に依存します。たとえば、線形回帰モデルはR²係数(数値回帰)であり、サポートベクタークラス分類器(クラス分類)は、正確さを使用します。正確さは基本的には良いクラス予測の数です。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more