Impatto ambientale intelligenza artificiale: quanto inquina l’AI?

Impact environnemental de l’intelligence artificielle : combien pollue l’IA ?

Rue depotphotos.com

Plus la complexité (les paramètres) des LLM augmente, plus leur impact environnemental augmente

(Rinnovabili.it) – Ouvrez ChatGPT et échangez 20 messages avec l’intelligence artificielle. Vous venez de consommer une pinte d’eau. Ce bref dialogue avec le chatbot a nécessité 500 ml d’eau pour refroidir les serveurs hébergeant le Large Language Model créé par OpenAI. Pour l’entraîner avant la sortie de sa première version publique, les litres d’eau « consommés » par ChatGPT 3.5 étaient d’au moins 3,5 millions. L’équivalent de la consommation quotidienne d’environ 25 000 citoyens européens. Ces quelques chiffres suffisent pour comprendre que l’impact environnemental de l’intelligence artificielle deviendra (est déjà) un sujet très pertinent.

Cependant, jusqu’à présent, les études et surtout les modèles pour surveiller et rendre compte des émissions et de l’empreinte environnementale de l’intelligence artificielle sont encore peu nombreux ou à leurs balbutiements. Dernièrementun rapport de l’OCDE présenté lors de la Cop27 en Egypte fin 2022, elle a proposé un cadre pour évaluer l’impact direct et indirect de l’IA, prenant en compte l’ensemble du cycle de vie, et évaluant divers facteurs dont les émissions, la consommation d’énergie, le prélèvement d’eau.

D’autre part, les études existantes se concentrent généralement sur des aspects ou des applications spécifiques plutôt que de tenter une estimation globale de l’ensemble du secteur. Il y a, par exemple, certains évaluations sur l’impact de la formation de certains réseaux de neurones: 550 tCO2 pour GPT-3, un peu moins de 50 tCO2 pour T5, environ 95 tCO2 pour Meena. C’est la plus petite tranche de consommation. De grandes entreprises comme Google et Amazon estiment maintenant qu’environ 90 % de la consommation d’énergie se produit avec la phase inférencec’est-à-dire le processus d’exécution d’un modèle d’apprentissage automatique entraîné.

L’empreinte environnementale de l’IA se navigue toujours à vue

L’un des gros problèmes liés à l’évaluation de l’empreinte environnementale de l’intelligence artificielle est la manque de transparence des entreprises. Non seulement beaucoup – y compris OpenAI – ne révèlent pas la base de données sur laquelle les modèles sont formés, mais ils ne donnent même pas de point de repère pour déduire l’impact de cette activité.

D’après Sasha Luccioni, qui travaille pour une société rivale d’OpenAI, le facteur à prendre en compte est l’augmentation de la complexité des modèles. La complexité d’un LLM est donnée par paramètres, c’est-à-dire des connexions internes au modèle qui lui permettent « d’apprendre » les chemins en fonction de la formation reçue. Plus il y a de paramètres, plus le modèle sera puissant et donnera de meilleurs résultats.

Une étude d’Emma Strubell de l’Université Carnegie Melon a estimé que l’entraînement d’un modèle appelé BERT sorti en 2019, avec 213 millions de paramètres, avait généré 280 tCO2. Luccioni souligne qu’entre-temps, nous avons atteint quelque chose comme 500 milliards de paramètres dans le modèle PaLM de Google de 2023. Mais, par exemple, nous n’avons pas la moindre idée du nombre de paramètres utilisés par ChatGPT-4, le dernier version d’Open AI. L’efficacité du matériel a tendance à réduire la consommation d’énergie, mais ne compense pas entièrement.

Ensuite, il faut considérer quel type d’énergie est utilisé. Luccioni a publié une étude dans laquelle il rend compte de l’empreinte environnementale du modèle lancé en 2022 par son entreprise, appelée FLORAISON. La formation a généré dans tout 25 tCO2qui devient 50 si l’on tient également compte des émissions générées pour produire tout le matériel nécessaire à son fonctionnement. 50 tCO2 sont équivalentes à celles produites par 60 vols Londres-New York. Mais BLOOM a été formé sur un superordinateur français à propulsion nucléaire : si le charbon et le gaz entrent dans le mélange, comme ils le font probablement, le total peut facilement être multiplié par 10 à 20. Plus, chaque jour de fonctionnement BLOOM génère 19 kgCO2 supplémentaires: autant qu’un trajet en voiture de 160 km en produit.

A lire également