データサイエンティストにとって使いやすい空間連続性を定量化するためのバリオグラムチュートリアル

データサイエンティストのためのバリオグラムチュートリアル

オープンソースのGSLibとPythonを使用した合成鉱業データセットへの適用

Sebastian Pichler氏による写真

はじめに

バリオグラムは、空間データの距離ベースの変動性を示すために使用されます。バリオグラムを使用して空間の連続性を理解し、モデル化することは重要です。バリオグラムは、鉱石の品位、油の濃度、または環境汚染物質など、さまざまなアプリケーションでポイント測定を実際のブロックに推定するために使用されます。

バリオグラムを生成するためにオープンソースのオプションが利用できるにもかかわらず、その複雑さのために、多くのユーザーは詳細を抽象化した高価なソフトウェアパッケージに頼っています。このチュートリアルでは、バリオグラムとその開発に独立して使用できるオープンソースのGeostatistics Library(GSLib)について簡単に紹介します。

ここでは、合成鉱業データセット上でバリオグラムモデルが開発されますが、このワークフローは温度などの気象アプリケーションや汚染物質の追跡など、任意の種類の空間データに使用することができます。

チュートリアルの要件

無料ダウンロードで利用可能なGSLibと、完全なコードにアップロードされている最も基本的で一般的に使用されるPythonライブラリが必要です:

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt

バリオグラムの基礎

バリオグラムの一般的なアイデアは、互いに遠いデータポイントほど異なる可能性が高くなるということです。データポイント同士が近いほど、データの全体的な分散と等しくなるまで、遠く離れたデータポイントの分散は増加します。

空間データセットから始めて、バリオグラムモデリングのワークフローを以下のようないくつかのステップに一般化できます。まず、バリオグラムの適切な検索パラメータを決定する必要があります。次に、主要な連続軸と副次的な連続軸を特定します。最後に、バリオグラムをモデル化し、それを推定またはシミュレーションの目的で使用することができます。各ステップは以下のセクションでさらに説明されます…

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more