「PythonのPandasライブラリを使用した非慣例的な日時変換の簡易化」

PythonのPandasライブラリを使った日時変換の簡略化

実生活の例で説明

Debby Hudsonによる写真、Unsplashから

背景

最近、クライアント企業の従業員が取得した休暇を分析するというタスクが与えられました。具体的には、従業員が特定の期間に休暇を取得したかどうかを理解し、最終的にはオフィスへの復帰ポリシーの遵守度を測定するための基準を設定する必要があります。

私は以下の2つの休暇データセットを提供されました:

  1. タイムオフデータ(「データセットA」)は、従業員が取得した有給休暇や病気休暇などの短期休暇を示しています。これらの休暇は、従業員ごとの日付レベルで一意でした(つまり、データセットの各行は特定の従業員が取得した休暇の日を表しています)。
  2. 休職データ(「データセットB」)は、従業員が取得した長期休暇の開始日と終了日を示しています。これらの休暇の例としては、育児休暇、産休、無給休暇、キャリアブレイクなどがあります。このデータセットは、長期休暇を取得した従業員のために「必要なときに休暇を取る」形式であり、各行は従業員の日付範囲を表しています(たとえば、従業員は30週間にわたって週3日ずつ育児休暇を取ることを好む場合、データセットの30行にわたって30の日付範囲が表示されます)。

これら2つのデータセットは、従業員が特定の期間に短期および長期休暇を取得する可能性があるため、お互いを補完しています。

私の分析では、2つのデータセットを共通の形式に統合し、特定の従業員のすべての休暇を考慮に入れたいと思っています。データセットAは既に日付ごとの従業員レベルで構造化された表形式ですので、データセットBを以下の画像に示すような類似の形式に変換する必要がありました(デモンストレーション用に作成したデータセットの例)。

画像1:日付変換。データセットと画像は筆者によるもの

方法論

画像1で示される変換は、「1対1」ではなく、日付を含むため、いくつかの課題を伴いました。変換を実現するために、私は以下の手順を踏みました。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「Seerの最高データオフィサーであるDr. Serafim Batzoglouによるインタビューシリーズ」

セラフィム・バツォグルはSeerのチーフデータオフィサーですSeerに加わる前は、セラフィムはInsitroのチーフデータオフィサー...

人工知能

Diginiのスマートセンスの社長、ガイ・イエヒアブによるインタビューシリーズ

ガイ・イハイアヴ氏は、ビジネスの成功に最も重要な資産を保護するためにインターネット・オブ・シングス(IoT)の力を活用す...

人工知能

ディープAIの共同創業者兼CEO、ケビン・バラゴナ氏- インタビューシリーズ

ディープAIの創設者であるケビン・バラゴナは、10年以上の経験を持つプロのソフトウェアエンジニア兼製品開発者です彼の目標...

データサイエンス

「2023年にデータサイエンスFAANGの仕事をゲットする方法は?」

データサイエンスは非常に求められる分野となり、FAANG(Facebook、Amazon、Apple、Netflix、Google)企業での就職は大きな成...

人工知能

「トリントの創設者兼CEO、ジェフ・コフマンへのインタビューシリーズ」

ジェフ・コーフマンは、ABC、CBS、CBCニュースで30年のキャリアを持った後、Trintの創設者兼CEOとなりましたジェフは手作業の...

人工知能

「コマンドバーの創設者兼CEO、ジェームズ・エバンスによるインタビューシリーズ」

ジェームズ・エバンズは、CommandBarの創設者兼CEOであり、製品、マーケティング、顧客チームを支援するために設計されたAIパ...