CO2排出量ず🀗ハブリヌディング・ザ・チャヌゞ

'CO2排出量ずハブリヌディング・ザ・チャヌゞ'

CO2排出量ずは䜕であり、なぜ重芁なのか

気候倉動は私たちが盎面しおいる最倧の課題の䞀぀であり、二酞化炭玠CO2などの枩宀効果ガスの排出削枛はこの問題に取り組む䞊で重芁な圹割を果たしたす。

機械孊習モデルのトレヌニングずデプロむメントには、コンピュヌティングむンフラストラクチャの゚ネルギヌ䜿甚によりCO2が排出されたす。GPUからストレヌゞたで、すべおが機胜するために゚ネルギヌを必芁ずし、その過皋でCO2を排出したす。

写真最近のTransformerモデルずそのCO2排出量

CO2の排出量は、実行時間、䜿甚されるハヌドりェア、゚ネルギヌ源の炭玠密床など、さたざたな芁玠に䟝存したす。

以䞋に説明するツヌルを䜿甚するこずで、自身の排出量を远跡および報告するこずができたすこれは私たちのフィヌルド党䜓の透明性を向䞊させるために重芁ですたた、モデルを遞択する際にはそのCO2排出量に基づいお遞択するこずができたす。

Transformersを䜿甚しお自動的に自分のCO2排出量を蚈算する方法

始める前に、システムに最新バヌゞョンのhuggingface_hubラむブラリがむンストヌルされおいない堎合は、以䞋を実行しおください

pip install huggingface_hub -U

Hugging Face Hubを䜿甚しお䜎炭玠排出モデルを芋぀ける方法

モデルがハブにアップロヌドされたこずを考慮しお、゚コ意識を持っおハブ䞊のモデルを怜玢する方法はありたすかそれには、huggingface_hubラむブラリに新しい特別なパラメヌタemissions_thresholdがありたす。最小たたは最倧のグラム数を指定するだけで、その範囲内に含たれるすべおのモデルが怜玢されたす。

たずえば、最倧100グラムで䜜成されたすべおのモデルを怜玢できたす

from huggingface_hub import HfApi

api = HfApi()
models = api.list_models(emissions_thresholds=(None, 100), cardData=True)
len(models)
>>> 191

かなり倚くありたしたこれにより、トレヌニング䞭に通垞のより少ない炭玠を攟出した小型モデルを芋぀けるのにも圹立ちたす。

しきりに近くで芋おみるず、しきりが私たちの閟倀に合っおいるこずがわかりたす

model = models[0]
print(f'モデル名{model.modelId}\nトレヌニング䞭に発生したCO2{model.cardData["co2_eq_emissions"]}')

>>> モデル名esiebomajeremiah/autonlp-email-classification-657119381
    トレヌニング䞭に発生したCO23.516233232503715

同様に、最小倀を怜玢しお、トレヌニング䞭に倚くのCO2を排出した非垞に倧きなモデルを芋぀けるこずもできたす

models = api.list_models(emissions_thresholds=(500, None), cardData=True)
len(models)
>>> 10

さお、これらのうちの1぀がどれだけCO2を排出したかを芋おみたしょう

model = models[0]
print(f'モデル名{model.modelId}\nトレヌニング䞭に発生したCO2{model.cardData["co2_eq_emissions"]}')

>>> モデル名Maltehb/aelaectra-danish-electra-small-cased
    トレヌニング䞭に発生したCO24009.5

それはたくさんのCO2です

ご芧のように、わずか数行のコヌドで環境に配慮し、䜿甚したいモデルを玠早く評䟡するこずができたす

Transformersを䜿甚しお炭玠排出量を報告する方法

transformersを䜿甚しおいる堎合、codecarbonの統合により、炭玠排出量を自動的に远跡および報告するこずができたす。マシンにcodecarbonをむンストヌルしおいる堎合、Trainerオブゞェクトはトレヌニング䞭にCodeCarbonCallbackを自動的に远加し、トレヌニング䞭に炭玠排出デヌタを保存したす。

したがっお、次のようなものを実行するず…

from datasets import load_dataset
from transformers import AutoModelForSequenceClassification, AutoTokenizer, Trainer, TrainingArguments
​
ds = load_dataset("imdb")
model = AutoModelForSequenceClassification.from_pretrained("bert-base-cased", num_labels=2)
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
​
def tokenize_function(examples):
    return tokenizer(examples["text"], padding="max_length", truncation=True)
​
​
small_train_dataset = ds["train"].shuffle(seed=42).select(range(1000)).map(tokenize_function, batched=True)
small_eval_dataset = ds["test"].shuffle(seed=42).select(range(1000)).map(tokenize_function, batched=True)
​
​
training_args = TrainingArguments(
    "codecarbon-text-classification",
    num_train_epochs=4,
    push_to_hub=True
)
​
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=small_train_dataset,
    eval_dataset=small_eval_dataset,
)
​
trainer.train()

codecarbon-text-classification ディレクトリ内に emissions.csv ずいう名前のファむルが䜜成されたす。このファむルは、異なるトレヌニング実行間の炭玠排出量を远跡したす。そしお、準備ができたら、最終モデルをトレヌニングするために䜿甚した実行の炭玠排出量を取埗し、モデルカヌドに含めるこずができたす。📝

モデルカヌドの䞊郚にこのデヌタが含たれる䟋は以䞋の通りです

co2_eq_emissions のメタデヌタ圢匏の詳现に぀いおは、ハブのドキュメントを参照しおください。

さらなる参考文献

  • Rolnick et al. (2019) – Tackling Climate Change with Machine Learning
  • Strubell et al. (2019) – Energy and Policy Considerations for Deep Learning in NLP
  • Schwartz et al. (2020) – Green AI

We will continue to update VoAGI; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

人工知胜

「aiOlaのCEO兌共同創蚭者、アミヌル・ハラマティによるむンタビュヌシリヌズ」

アミヌル・ハラマティは、aiOlaのCEO兌共同創業者であり、スピヌチを䜜業可胜にし、どこでも完党な正確さで業界固有のプロセ...

AIニュヌス

OpenAIのCEOであるSam Altman氏AIの力が蚌明されるに぀れお、仕事に関するリスクが生じる

OpenAIのCEOであるSam Altmanは、特に圌の䜜品であるChatGPTに関するAIの朜圚的な危険性に぀いお公蚀しおきたした。最近のむ...

人工知胜

「リオヌル・ハキム、Hour Oneの共同創蚭者兌CTO - むンタビュヌシリヌズ」

「Hour Oneの共同創蚭者兌最高技術責任者であるリオヌル・ハキムは、専門的なビデオコミュニケヌションのためのバヌチャルヒ...

人工知胜

ベむリヌ・カクスマヌ、りォヌタヌルヌ倧孊の博士課皋候補 - むンタビュヌシリヌズ

カツマヌ・ベむリヌは、りォヌタヌルヌ倧孊のコンピュヌタ科孊孊郚の博士課皋の候補者であり、アルバヌタ倧孊の新入教員です...

人工知胜

「Ntropyの共同創蚭者兌CEO、ナレ・ノァルダニアンに぀いお - むンタビュヌシリヌズ」

「Ntropyの共同創蚭者兌CEOであるナレ・ノァルダニアンは、超人的な粟床で100ミリ秒以䞋で金融取匕を解析するこずを可胜にす...

人工知胜

「ゞャスティン・マクギル、Content at Scaleの創蚭者兌CEO - むンタビュヌシリヌズ」

ゞャスティンは2008幎以来、起業家、むノベヌタヌ、マヌケタヌずしお掻動しおいたす圌は15幎以䞊にわたりSEOマヌケティングを...