モデルの精度向上:Spotifyでの機械学習論文で学んだテクニック(+コードスニペット)

モデルの精度向上:Spotifyの機械学習論文から学んだテクニック(+コードスニペット)

頑固な機械学習モデルを改善するためのテックデータサイエンティストのスタック

この記事は、Spotifyでの私の機械学習論文からの学びを記録した2部作の一部です。この研究での特徴の重要性の実装方法についてもぜひ確認してください。

2021年、Spotifyでの私の論文の一環として、ユーザー満足度を測定する予測モデルの構築に8ヶ月を費やしました。

Image by Author

私の目標は、ユーザーが音楽体験に満足している要因を理解することでした。それには、LightGBM分類器を構築しました。その出力はバイナリな応答であり、y = 1 ならばユーザーは満足している、y = 0 ならばあまり満足していないという意味です。

人間の満足度を予測することは難しい課題です。人間は定義上、満足していません。機械でさえも人間の心理の謎を解読するのは難しいです。そのため、私のモデルは自然と混乱してしまいました。

人間の予測者から占い師へ

私の正解率は約0.5で、これは分類器で得られる最悪の結果です。これはアルゴリズムが「はい」または「いいえ」を予測する確率が50%であり、人間の推測と同じくらいランダムです。

そのため、私は2ヶ月間、異なる技術を試して組み合わせながらモデルの予測を改善しようとしました。結果として、私はROCスコアを0.5から0.73に改善することができました。これは大きな成功でした!

この記事では、モデルの正確性を大幅に向上させるために使用した技術を共有します。モデルがうまく動かない場合に役立つかもしれません。

この研究の機密性のため、敏感な情報を共有することはできませんが、混乱しないように最善の努力をするつもりです。

#0. データの準備

使用した方法に入る前に、まず基本を押さえておく必要があります。これらの方法のいくつかは、変数のエンコードやデータの準備に依存しています。コードの一部も参照しています…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

機械学習

このAIニュースレターは、あなたが必要とするすべてです #56

今週、オープンソースとクローズドモデルの両方で、LLMの世界にいくつかの新しい競合他社が登場しました印象的な機能を持つに...

AI研究

このAI研究では、LSS Transformerを発表しましたこれは、Transformerにおける効率的な長いシーケンスの学習を革新的なAIアプローチで実現します

新しいAI研究では、Long Short-Sequence Transformer (LSS Transformer)という効率的な分散学習手法が紹介されました。この手...

データサイエンス

「データストーリーテリングとアナリティクスにおける生成AIのインパクトの公開」

導入 データ分析の広大な領域の中で、ゲネラティブ人工知能(GAI)はゲームを変える最も重要な進展の一つです。これは、歴史...

データサイエンス

『nnU-Netの究極ガイド』

「画像セグメンテーションの主要なツールであるnnU-Netについて、詳細なガイドに深く入り込んでください最先端の結果を得るた...

AIニュース

欧州とイスラエルのAIファーストスタートアップのための新しいアクセラレータ

この10週間のプログラムは、Googleとそのネットワークの最高の部分を活用して、AIをコアビジネスに使用しているスタートアッ...

人工知能

AIを使ってYouTubeショートを作成する

AIツールを使えばYouTube Shortsを作るのが非常に簡単になりましたこの記事では、その方法を紹介します