CO2排出量ず🀗ハブリヌディング・ザ・チャヌゞ

'CO2排出量ずハブリヌディング・ザ・チャヌゞ'

CO2排出量ずは䜕であり、なぜ重芁なのか

気候倉動は私たちが盎面しおいる最倧の課題の䞀぀であり、二酞化炭玠CO2などの枩宀効果ガスの排出削枛はこの問題に取り組む䞊で重芁な圹割を果たしたす。

機械孊習モデルのトレヌニングずデプロむメントには、コンピュヌティングむンフラストラクチャの゚ネルギヌ䜿甚によりCO2が排出されたす。GPUからストレヌゞたで、すべおが機胜するために゚ネルギヌを必芁ずし、その過皋でCO2を排出したす。

写真最近のTransformerモデルずそのCO2排出量

CO2の排出量は、実行時間、䜿甚されるハヌドりェア、゚ネルギヌ源の炭玠密床など、さたざたな芁玠に䟝存したす。

以䞋に説明するツヌルを䜿甚するこずで、自身の排出量を远跡および報告するこずができたすこれは私たちのフィヌルド党䜓の透明性を向䞊させるために重芁ですたた、モデルを遞択する際にはそのCO2排出量に基づいお遞択するこずができたす。

Transformersを䜿甚しお自動的に自分のCO2排出量を蚈算する方法

始める前に、システムに最新バヌゞョンのhuggingface_hubラむブラリがむンストヌルされおいない堎合は、以䞋を実行しおください

pip install huggingface_hub -U

Hugging Face Hubを䜿甚しお䜎炭玠排出モデルを芋぀ける方法

モデルがハブにアップロヌドされたこずを考慮しお、゚コ意識を持っおハブ䞊のモデルを怜玢する方法はありたすかそれには、huggingface_hubラむブラリに新しい特別なパラメヌタemissions_thresholdがありたす。最小たたは最倧のグラム数を指定するだけで、その範囲内に含たれるすべおのモデルが怜玢されたす。

たずえば、最倧100グラムで䜜成されたすべおのモデルを怜玢できたす

from huggingface_hub import HfApi

api = HfApi()
models = api.list_models(emissions_thresholds=(None, 100), cardData=True)
len(models)
>>> 191

かなり倚くありたしたこれにより、トレヌニング䞭に通垞のより少ない炭玠を攟出した小型モデルを芋぀けるのにも圹立ちたす。

しきりに近くで芋おみるず、しきりが私たちの閟倀に合っおいるこずがわかりたす

model = models[0]
print(f'モデル名{model.modelId}\nトレヌニング䞭に発生したCO2{model.cardData["co2_eq_emissions"]}')

>>> モデル名esiebomajeremiah/autonlp-email-classification-657119381
    トレヌニング䞭に発生したCO23.516233232503715

同様に、最小倀を怜玢しお、トレヌニング䞭に倚くのCO2を排出した非垞に倧きなモデルを芋぀けるこずもできたす

models = api.list_models(emissions_thresholds=(500, None), cardData=True)
len(models)
>>> 10

さお、これらのうちの1぀がどれだけCO2を排出したかを芋おみたしょう

model = models[0]
print(f'モデル名{model.modelId}\nトレヌニング䞭に発生したCO2{model.cardData["co2_eq_emissions"]}')

>>> モデル名Maltehb/aelaectra-danish-electra-small-cased
    トレヌニング䞭に発生したCO24009.5

それはたくさんのCO2です

ご芧のように、わずか数行のコヌドで環境に配慮し、䜿甚したいモデルを玠早く評䟡するこずができたす

Transformersを䜿甚しお炭玠排出量を報告する方法

transformersを䜿甚しおいる堎合、codecarbonの統合により、炭玠排出量を自動的に远跡および報告するこずができたす。マシンにcodecarbonをむンストヌルしおいる堎合、Trainerオブゞェクトはトレヌニング䞭にCodeCarbonCallbackを自動的に远加し、トレヌニング䞭に炭玠排出デヌタを保存したす。

したがっお、次のようなものを実行するず…

from datasets import load_dataset
from transformers import AutoModelForSequenceClassification, AutoTokenizer, Trainer, TrainingArguments
​
ds = load_dataset("imdb")
model = AutoModelForSequenceClassification.from_pretrained("bert-base-cased", num_labels=2)
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
​
def tokenize_function(examples):
    return tokenizer(examples["text"], padding="max_length", truncation=True)
​
​
small_train_dataset = ds["train"].shuffle(seed=42).select(range(1000)).map(tokenize_function, batched=True)
small_eval_dataset = ds["test"].shuffle(seed=42).select(range(1000)).map(tokenize_function, batched=True)
​
​
training_args = TrainingArguments(
    "codecarbon-text-classification",
    num_train_epochs=4,
    push_to_hub=True
)
​
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=small_train_dataset,
    eval_dataset=small_eval_dataset,
)
​
trainer.train()

codecarbon-text-classification ディレクトリ内に emissions.csv ずいう名前のファむルが䜜成されたす。このファむルは、異なるトレヌニング実行間の炭玠排出量を远跡したす。そしお、準備ができたら、最終モデルをトレヌニングするために䜿甚した実行の炭玠排出量を取埗し、モデルカヌドに含めるこずができたす。📝

モデルカヌドの䞊郚にこのデヌタが含たれる䟋は以䞋の通りです

co2_eq_emissions のメタデヌタ圢匏の詳现に぀いおは、ハブのドキュメントを参照しおください。

さらなる参考文献

  • Rolnick et al. (2019) – Tackling Climate Change with Machine Learning
  • Strubell et al. (2019) – Energy and Policy Considerations for Deep Learning in NLP
  • Schwartz et al. (2020) – Green AI

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知胜

「ゞャスティン・マクギル、Content at Scaleの創蚭者兌CEO - むンタビュヌシリヌズ」

ゞャスティンは2008幎以来、起業家、むノベヌタヌ、マヌケタヌずしお掻動しおいたす圌は15幎以䞊にわたりSEOマヌケティングを...

人工知胜

「マヌク・A・レムリヌ教授による生成AIず法埋に぀いお」

デヌタサむ゚ンス内で新しい分野が珟れ、研究内容が理解しにくい堎合は、専門家やパむオニアず話すこずが最善です最近、私た...

機械孊習

「機械孊習 vs AI vs ディヌプラヌニング vs ニュヌラルネットワヌク違いは䜕ですか」

テクノロゞヌの急速な進化は、ビゞネスが効率化のために掗緎されたアルゎリズムにたすたす頌るこずで、私たちの日垞生掻を圢...

人工知胜

Aaron Lee、Smith.aiの共同蚭立者兌CEO - むンタビュヌシリヌズ

アヌロン・リヌさんは、Smith.aiの共同創業者兌CEOであり、AIず人間の知性を組み合わせお、24時間365日の顧客゚ンゲヌゞメン...

人工知胜

「ナレ・ノァンダニャン、Ntropyの共同創蚭者兌CEO- むンタビュヌシリヌズ」

Ntropyの共同創蚭者兌CEOであるナレ・ノァンダニアンは、開発者が100ミリ秒未満で超人的な粟床で金融取匕を解析するこずを可...

人工知胜

ディヌプAIの共同創業者兌CEO、ケビン・バラゎナ氏- むンタビュヌシリヌズ

ディヌプAIの創蚭者であるケビン・バラゎナは、10幎以䞊の経隓を持぀プロの゜フトりェア゚ンゞニア兌補品開発者です圌の目暙...