ヒストグラムに対する3つの最良の(しばしばより良い)代替方法

ヒストグラムの最良の代替方法3つ

ヒストグラムの最も危険な落とし穴を避ける方法

Leonardo AIによるイメージ

ビニングバイアス、ヒストグラムの最大の欠点

ヒストグラムは、データサイエンティストとしての旅立ちにおいて、おそらく最初に使用したプロットです。彼らは直感的で、分布の形状を理解するのに簡単なプロットです。

しかし、旅を進めるにつれて、ヒストグラムがそんなに理想的ではないことがわかるでしょう。ヒストグラムは値をビンと呼ばれる区間にグループ化し、ヒストグラム内の各ビンの高さはそのビン内の点の数を示します。以下の例を考えてみましょう:

著者によるイメージ

このヒストグラムから、ほとんどのスコアが60から80の間にあることがすぐにわかります。では、ビンの数を10から20に変更した場合はどうなるでしょう:

著者によるイメージ

それでも、前の傾向は明らかです。では、今度は20から40に変更してみましょう:

著者によるイメージ

これで、分布が見かけほどスムーズではないことがわかります。40のビンでは、40、62、68、80周辺に小さなピークが見られます。したがって、ビンの数は実際には分布に関する重要な洞察を隠す可能性があります。

ただし、ビンの数をあまりにも変更しすぎると、ランダムなノイズが導入されて重要な発見のように見えるかもしれません。これがヒストグラムの最大の欠点であるビニングバイアスです。

ビニングバイアスは、プロットのためのビンの数を変更すると同じデータの異なる表現が得られるヒストグラムの落とし穴です。

後のセクションでは、ビニングバイアスを回避し、分布を比較するためにより良い結果を提供する3つのヒストグラムの代替手段を見ていきます。

離散データと連続データの復習

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

ギル・ジェロン、Orca SecurityのCEO&共同創設者-インタビューシリーズ

ギル・ゲロンは、オルカ・セキュリティのCEO兼共同設立者ですギルは20年以上にわたりサイバーセキュリティ製品をリードし、提...

AIニュース

OpenAIのCEOであるSam Altman氏:AIの力が証明されるにつれて、仕事に関するリスクが生じる

OpenAIのCEOであるSam Altmanは、特に彼の作品であるChatGPTに関するAIの潜在的な危険性について公言してきました。最近のイ...

人工知能

「15Rockの共同創業者兼CEO、ガウタム・バクシ氏によるインタビューシリーズ」

「ガウタム・バクシは、気候リスク管理とアドバイザリーサービスのグローバルリーダーである15Rockの共同創設者兼CEOですガウ...

人工知能

Aaron Lee、Smith.aiの共同設立者兼CEO - インタビューシリーズ

アーロン・リーさんは、Smith.aiの共同創業者兼CEOであり、AIと人間の知性を組み合わせて、24時間365日の顧客エンゲージメン...

人工知能

「リオール・ハキム、Hour Oneの共同創設者兼CTO - インタビューシリーズ」

「Hour Oneの共同創設者兼最高技術責任者であるリオール・ハキムは、専門的なビデオコミュニケーションのためのバーチャルヒ...

人工知能

ジョナサン・ダムブロット、Cranium AIのCEO兼共同創設者- インタビューシリーズ

ジョナサン・ダムブロットは、Cranium AIのCEO兼共同創業者ですCranium AIは、サイバーセキュリティおよびデータサイエンスチ...