La aparición fulgurante de modelos de inteligencia artificial como ChatGPT y Gemini plantea interrogantes fundamentales sobre su costo real de entrenamiento. Los recientes avances tecnológicos vienen acompañados de gastos exorbitantes y una huella ecológica preocupante. Dirigir esta reflexión implica un análisis minucioso de los desafíos financieros, donde las estimaciones se cuentan en millones, e incluso en miles de millones de dólares. La necesidad de optimizar estos recursos se hace apremiante frente a desafíos ambientales crecientes, que involucran tanto tecnologías innovadoras como prácticas sostenibles.
El entrenamiento de modelos de IA: un costo exponencial
Los gastos relacionados con el entrenamiento de modelos de inteligencia artificial, como ChatGPT y Gemini, están experimentando un aumento fulgurante. Las primeras generaciones de estos modelos requerían inversiones de algunos millones de dólares. Hoy en día, estas cifras han explotado, alcanzando cientos de millones, e incluso miles de millones para los modelos que están por venir.
Según una estimación de Dario Amodei, CEO de Cohere, el costo de entrenamiento actual asciende a 100 millones de dólares. Algunos modelos en desarrollo podrían costar hasta mil millones de dólares. Amodei predice que los gastos podrían alcanzar niveles vertiginosos, situándose entre diez y cien mil millones de dólares en un futuro cercano.
Un estudio de Epoch AI subraya que los costos de entrenamiento de los modelos de inteligencia artificial han aumentado a un ritmo impresionante. Desde 2016, estos costos están aumentando a un ritmo de 2,4 veces por año. Esta inflación de precios podría dejar fuera de juego a las empresas con recursos limitados.
Costos de entrenamiento específicos de los modelos de IA
El costo de entrenamiento del modelo GPT-4, introducido por OpenAI en 2023, se estima en más de 100 millones de dólares. Paralelamente, el entrenamiento del modelo Gemini 1 habría requerido por parte de Google una inversión cercana a 191 millones de dólares. Estas cifras incluyen la adquisición de GPU, cuyo precio unitario oscila entre 30,000 y 40,000 dólares, así como los gastos de infraestructura en la nube.
Las implicaciones financieras y la burbuja de la IA
David Cahn, analista en Sequoia Capital, advierte sobre el riesgo de una burbuja financiera. Para equilibrar las inversiones en el sector, las grandes empresas deben generar aproximadamente 600 mil millones de dólares en ingresos anuales. Suponiendo que cada una de ellas genere 10 mil millones de dólares a través de la inteligencia artificial, habría una brecha de 500 mil millones de dólares por cerrar.
Los costos colosales generan una presión creciente sobre las empresas, que deben explorar técnicas de optimización para reducir los tiempos de entrenamiento de los modelos. El método JEST, desarrollado por Google Deepmind, podría reducir los cálculos necesarios hasta en diez veces.
Impacto ambiental y consumo energético
Las preocupaciones sobre el impacto ambiental del entrenamiento de modelos de IA se intensifican. El consumo energético está basado en necesidades inmensas, requiriendo soluciones de refrigeración innovadoras para prevenir el sobrecalentamiento de los servidores. El superordenador Jean Zay, ubicado en Francia, utiliza un sistema de refrigeración por agua, reutilizando el agua caliente para los edificios cercanos.
Además, la huella hídrica representa un desafío a menudo subestimado. Un estudio estadounidense indica que hacer de 20 a 50 preguntas a GPT-3 consume un volumen de agua equivalente a una botella de 50 cl destinada a la refrigeración de servidores. Este consumo podría alcanzar de 4 a 6,5 mil millones de metros cúbicos de agua dulce para 2027, lo que representa una extracción considerable comparable a la de Dinamarca.
Iniciativas para una mejor sostenibilidad
Frente a esta problemática, algunas empresas, como Microsoft, están adoptando nuevas estrategias energéticas. En 2024, el gigante tecnológico firmó un acuerdo para reactivar la planta nuclear de Three Mile Island para alimentar sus centros de datos para 2028. Esta decisión genera debates, ya que ocurre en un momento en que Microsoft trabaja para reducir sus emisiones de CO2.
Regular la IA para un futuro sostenible
Los actores del sector están esforzándose por establecer prácticas sostenibles para el entrenamiento de modelos de IA. Soluciones como la refrigeración por agua, innovadas por Atos, ayudan a limitar el consumo de agua mientras se mantiene la eficiencia energética. Esta técnica podría reducir los costos energéticos de manera significativa, en un rango del 20 al 30%.
Un decreto recientemente firmado por el presidente estadounidense Joe Biden busca facilitar el acceso a recursos para los investigadores, con el fin de evitar la concentración del desarrollo de la IA en manos de unas pocas empresas. Una mayor transparencia sobre la huella de carbono y la huella hídrica de los modelos de IA podría surgir, fomentando un enfoque más responsable.
Los desafíos relacionados con el consumo de energía, la huella hídrica y los sobrecostos siguen siendo apremiantes en la búsqueda de un equilibrio entre la innovación tecnológica y el desarrollo sostenible, situando al sector en el centro de un debate necesario.
Preguntas Frecuentes
¿Cuál es el costo de entrenamiento de un modelo de IA como ChatGPT?
El costo de entrenamiento de un modelo como ChatGPT se estima en más de 100 millones de dólares, debido a las necesidades de hardware e infraestructuras en la nube.
¿Por qué ha aumentado tanto el costo del entrenamiento de los modelos de IA en los últimos años?
El aumento del costo se explica por el incremento de los requisitos de potencia de cálculo, en particular el uso de costosas GPU y la inflación de los costos de infraestructuras.
¿Cuál es el impacto ambiental asociado al entrenamiento de modelos como Gemini?
El entrenamiento de modelos como Gemini tiene un impacto ambiental significativo, con un alto consumo energético y una preocupante huella hídrica, que podría alcanzar varios miles de millones de metros cúbicos de agua dulce en unos años.
¿Cómo intentan las empresas reducir los costos de entrenamiento de las IA?
Las empresas están explorando técnicas de optimización, como el método JEST de Google, que podría reducir los cálculos necesarios hasta en diez veces, así como métodos de refrigeración más eficientes.
¿Cuáles son los costos incluidos en el entrenamiento de un modelo de IA?
Los costos de entrenamiento incluyen la adquisición de hardware como las GPU, los gastos relacionados con las infraestructuras en la nube, y otros gastos operativos como energía y refrigeración de servidores.
¿Hay una burbuja financiera en torno a las inversiones en IA?
Algunos analistas, como David Cahn, advierten sobre un posible hueco financiero, señalando que las grandes empresas deben generar ingresos sustanciales para equilibrar sus inversiones.
¿Son transparentes los costos de entrenamiento de los modelos de IA?
A menudo, los costos de entrenamiento no son compartidos públicamente por las empresas, lo que dificulta obtener una imagen completa de los gastos reales.
¿Qué modelos de IA son los más costosos de entrenar actualmente?
Modelos recientes como GPT-4 y Gemini 1 se encuentran entre los más costosos, con estimaciones que superan los 100 millones de dólares para el primero y cerca de 191 millones para el segundo.
¿Se puede medir el impacto de carbono de un entrenamiento de IA?
Sí, estudios han demostrado que la formación de un modelo como GPT-3 ha liberado el equivalente a 502 toneladas de CO2, subrayando la importancia de considerar la huella de carbono de los modelos de IA.
¿Qué iniciativas se están tomando para hacer que el entrenamiento de IA sea más sostenible?
Las iniciativas incluyen investigaciones sobre métodos de refrigeración más eficientes y esfuerzos para diversificar las fuentes de energía utilizadas durante el entrenamiento de los modelos.