探索的データ分析:YouTubeチャンネルについての知識は何か(パート2)
『YouTubeチャンネルの知識を探求する:データ分析の新たな発見(パート2)』
PandasとYouTube Data APIを使用して統計的なinsightsを得る
このストーリーの最初の部分では、約3000のYouTubeチャンネルから統計データを収集し、興味深いinsightsを得ました。今回は、一般的な「チャンネル」から個別の「動画」レベルまで少し深く掘り下げます。YouTubeの動画に関するデータを収集する方法と、どのようなinsightsを得ることができるかを紹介します。
方法論
YouTubeの動画に関するデータを収集するために、次の手順を実行する必要があります:
- YouTube Data APIの認証情報を取得します。無料で利用でき、1日あたりのAPI制限が10,000リクエストなので、私たちのタスクには十分です。
- 分析したいいくつかのYouTubeチャンネルを見つけます。
- 選択したチャンネルの最新の動画とそれらの統計データを取得するためのPythonコードを書きます。YouTubeアナリティクスはチャンネルの所有者にのみ利用可能であり、現在の時点でのデータのみ取得できます。ただし、コードを一定期間実行することはできます。私の場合、Apache AirflowとRaspberry Piを使用して約3週間のデータを収集しました。
- データ分析を実行します。そのためには、Pandas、Matplotlib、およびSeabornを使用します。
YouTube APIの認証情報の取得とApache AirFlowの設定については、以前の記事で説明しました。この記事では、この部分を一時停止して先にその部分を読むことをお勧めします。
探索的データ分析:YouTubeチャンネルについての知識
PandasとYouTube Data APIを使用して統計的なinsightsを得る
towardsdatascience.com
それでは、始めましょう。
1. データの取得
YouTubeの動画に関する情報を取得するために、python-youtubeライブラリを使用します。驚くべきことに、特定のチャンネルから動画のリストを取得するためのReady-to-useなメソッドは存在せず、自分で実装する必要があります。
まず、基本情報を取得するためのget_channel_info
メソッドを呼び出す必要があります。その名前が示すとおり、このメソッドはチャンネルに関する基本情報を返します。
from pyyoutube import Apidef get_channel_info(api: Api, channel_id: str)…
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles