「PythonのPandasライブラリを使用した非慣例的な日時変換の簡易化」

PythonのPandasライブラリを使った日時変換の簡略化

実生活の例で説明

Debby Hudsonによる写真、Unsplashから

背景

最近、クライアント企業の従業員が取得した休暇を分析するというタスクが与えられました。具体的には、従業員が特定の期間に休暇を取得したかどうかを理解し、最終的にはオフィスへの復帰ポリシーの遵守度を測定するための基準を設定する必要があります。

私は以下の2つの休暇データセットを提供されました:

  1. タイムオフデータ(「データセットA」)は、従業員が取得した有給休暇や病気休暇などの短期休暇を示しています。これらの休暇は、従業員ごとの日付レベルで一意でした(つまり、データセットの各行は特定の従業員が取得した休暇の日を表しています)。
  2. 休職データ(「データセットB」)は、従業員が取得した長期休暇の開始日と終了日を示しています。これらの休暇の例としては、育児休暇、産休、無給休暇、キャリアブレイクなどがあります。このデータセットは、長期休暇を取得した従業員のために「必要なときに休暇を取る」形式であり、各行は従業員の日付範囲を表しています(たとえば、従業員は30週間にわたって週3日ずつ育児休暇を取ることを好む場合、データセットの30行にわたって30の日付範囲が表示されます)。

これら2つのデータセットは、従業員が特定の期間に短期および長期休暇を取得する可能性があるため、お互いを補完しています。

私の分析では、2つのデータセットを共通の形式に統合し、特定の従業員のすべての休暇を考慮に入れたいと思っています。データセットAは既に日付ごとの従業員レベルで構造化された表形式ですので、データセットBを以下の画像に示すような類似の形式に変換する必要がありました(デモンストレーション用に作成したデータセットの例)。

画像1:日付変換。データセットと画像は筆者によるもの

方法論

画像1で示される変換は、「1対1」ではなく、日付を含むため、いくつかの課題を伴いました。変換を実現するために、私は以下の手順を踏みました。

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

データサイエンス

「Seerの最高データオフィサーであるDr. Serafim Batzoglouによるインタビューシリーズ」

セラフィム・バツォグルはSeerのチーフデータオフィサーですSeerに加わる前は、セラフィムはInsitroのチーフデータオフィサー...

人工知能

「ジンディのCEO兼共同創設者、セリーナ・リー― インタビューシリーズ」

「Celina Leeは、ZindiのCEO兼共同創設者であり、アフリカのデータサイエンティスト向けの最大の専門ネットワークです Celina...

人工知能

アーティスの創設者兼CEO、ウィリアム・ウーによるインタビューシリーズ

ウィリアム・ウーは、Artisseの創設者兼CEOであり、ユーザーの好みに基づいて写真を精密に変更する技術を提供していますそれ...

人工知能

「トリントの創設者兼CEO、ジェフ・コフマンへのインタビューシリーズ」

ジェフ・コーフマンは、ABC、CBS、CBCニュースで30年のキャリアを持った後、Trintの創設者兼CEOとなりましたジェフは手作業の...

データサイエンス

アステラソフトウェアのCOO、ジェイ・ミシュラ - インタビューシリーズ

ジェイ・ミシュラは、急速に成長しているエンタープライズ向けデータソリューションの提供企業であるAstera Softwareの最高執...

人工知能

「LeanTaaSの創設者兼CEO、モハン・ギリダラダスによるインタビューシリーズ」

モーハン・ギリダラダスは、AIを活用したSaaSベースのキャパシティ管理、スタッフ配置、患者フローのソフトウェアを提供する...