Pythonコードの品質向上ガイド:データサイエンティストのためのガイド
Pythonコードの品質向上ガイド
プロダクションに適したPythonコードを書くためのツールとパッケージ
背景
最近、データサイエンティストは機械学習モデルのデプロイメントのプロダクション側にますます関与しています。これは、私たちもソフトウェアエンジニアと同様にプロダクションスタンダードのPythonコードを書く必要があることを意味します。この記事では、次のモデルのためにプロダクションに適したコードを作成するのに役立ついくつかの主要なツールとパッケージについて説明します。
リンター
概要
リンターは、ランタイムの問題や予期しない出力につながる可能性のある小さなバグ、書式エラー、奇妙なデザインパターンをキャッチするツールです。
Pythonでは、幸いにも PEP8 があり、私たちのコードがどのように見えるべきかについてのグローバルなスタイルガイドを提供しています。PythonにはPEP8に準拠する多くのリンターが存在しますが、私の好みは flake8 です。
Flake8
Flake8は、実際には Pyflakes、pycodestyle、および McCabe のリンティングパッケージの組み合わせです。エラーや コードの臭い をチェックし、PEP8の規格を遵守します。
- 「Meetupsからメンタリングまで データサイエンティストとしてのネットワーキングの方法」
- 「データからドルへ:線形回帰の利用」
- 「Amazon SageMaker Canvasによるデータ処理、トレーニング、推論におけるパフォーマンスを70%向上させ、ビジネスの成果を加速させましょう」
flake8をインストールするには、pip install flake8
を実行し、flake8 <file_name.py>
を使用します。それほど簡単です!
例えば、ファイル flake8_example.py
に関数 add_numbers
があるとします:
def add_numbers(a,b): result = a+ b return resultprint(add_numbers(5, 10))
このファイルに対してflake8を呼び出すために、flake8 flake8_example.py
を実行し、出力は以下のようになります:
Flake8は、PEP8に合わせるために修正すべきスタイルエラーをいくつか検出しました。
自分のニーズに合わせてflake8をカスタマイズする方法など、詳細はこちらをご覧ください。
コードフォーマッター
概要
リンターはしばしばコードの問題を指摘するだけで、実際にはそれを修正しません。フォーマッターは、コードを修正し、作業効率を向上させ、スタイルガイドに準拠し、他の人にとっても読みやすくします。
isort
We will continue to update VoAGI; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles