ヒストグラムに対する3つの最良の(しばしばより良い)代替方法

ヒストグラムの最良の代替方法3つ

ヒストグラムの最も危険な落とし穴を避ける方法

Leonardo AIによるイメージ

ビニングバイアス、ヒストグラムの最大の欠点

ヒストグラムは、データサイエンティストとしての旅立ちにおいて、おそらく最初に使用したプロットです。彼らは直感的で、分布の形状を理解するのに簡単なプロットです。

しかし、旅を進めるにつれて、ヒストグラムがそんなに理想的ではないことがわかるでしょう。ヒストグラムは値をビンと呼ばれる区間にグループ化し、ヒストグラム内の各ビンの高さはそのビン内の点の数を示します。以下の例を考えてみましょう:

著者によるイメージ

このヒストグラムから、ほとんどのスコアが60から80の間にあることがすぐにわかります。では、ビンの数を10から20に変更した場合はどうなるでしょう:

著者によるイメージ

それでも、前の傾向は明らかです。では、今度は20から40に変更してみましょう:

著者によるイメージ

これで、分布が見かけほどスムーズではないことがわかります。40のビンでは、40、62、68、80周辺に小さなピークが見られます。したがって、ビンの数は実際には分布に関する重要な洞察を隠す可能性があります。

ただし、ビンの数をあまりにも変更しすぎると、ランダムなノイズが導入されて重要な発見のように見えるかもしれません。これがヒストグラムの最大の欠点であるビニングバイアスです。

ビニングバイアスは、プロットのためのビンの数を変更すると同じデータの異なる表現が得られるヒストグラムの落とし穴です。

後のセクションでは、ビニングバイアスを回避し、分布を比較するためにより良い結果を提供する3つのヒストグラムの代替手段を見ていきます。

離散データと連続データの復習

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知能

「サティスファイラボのCEO兼共同創設者、ドニー・ホワイト- インタビューシリーズ」

2016年に設立されたSatisfi Labsは、会話型AI企業のリーディングカンパニーです早期の成功は、ニューヨーク・メッツ、メイシ...

人工知能

『DeepHowのCEO兼共同創業者、サム・ジェン氏によるインタビューシリーズ』

ディープハウのCEO兼共同創設者であるサム・ジェンは、著名な投資家から支持される急速に進化するスタートアップを率いていま...

人工知能

「アナコンダのCEO兼共同創業者、ピーターウォングによるインタビューシリーズ」

ピーター・ワンはAnacondaのCEO兼共同創設者ですAnaconda(以前はContinuum Analyticsとして知られる)を設立する前は、ピー...

人工知能

「Ntropyの共同創設者兼CEO、ナレ・ヴァルダニアンについて - インタビューシリーズ」

「Ntropyの共同創設者兼CEOであるナレ・ヴァルダニアンは、超人的な精度で100ミリ秒以下で金融取引を解析することを可能にす...

人工知能

「15Rockの共同創業者兼CEO、ガウタム・バクシ氏によるインタビューシリーズ」

「ガウタム・バクシは、気候リスク管理とアドバイザリーサービスのグローバルリーダーである15Rockの共同創設者兼CEOですガウ...

人工知能

ディープAIの共同創業者兼CEO、ケビン・バラゴナ氏- インタビューシリーズ

ディープAIの創設者であるケビン・バラゴナは、10年以上の経験を持つプロのソフトウェアエンジニア兼製品開発者です彼の目標...