Вычислительная мощность и искусственный интеллект

Комплексный анализ роли вычислительных мощностей в развитии ИИ, инфраструктурных потребностей и последствий для политики

By Jai Vipra & Sarah Myers West | AI Now Institute

Опубликовано: сентябрь 2023

Обзор отчёта

В данном отчёте исследуется ключевая роль вычислительной мощности ("compute") в системах искусственного интеллекта. По мере увеличения размеров и сложности моделей ИИ их вычислительные требования растут беспрецедентными темпами, создавая новые проблемы и последствия в технической, экологической, экономической и политической сферах.

Мы анализируем полный стек вычислительной инфраструктуры — от аппаратных компонентов до центров обработки данных — и исследуем, как ограничения и распределение вычислительных ресурсов влияют на развитие ИИ, определяют круг участников и типы создаваемых систем искусственного интеллекта.

Key Data Points

Рост спроса на вычислительные мощности

Вычислительные требования для обучения больших моделей ИИ удваиваются каждые 3-4 месяца с 2012 года, что значительно опережает закон Мура.

Потребление энергии

Обучение одной крупной языковой модели может потреблять количество электроэнергии, эквивалентное годовому энергопотреблению более 100 американских домов.

Концентрация рынка

Всего три компании контролируют свыше 65% рынка облачных вычислений, обеспечивающего инфраструктуру для обучения ИИ.

Carbon Footprint

К 2025 году вычислительные потребности сектора ИИ могут достигать до 3% мирового потребления электроэнергии.

Ключевые выводы: краткий обзор

Вычислительные мощности определяют возможности ИИ

Масштаб вычислительных ресурсов напрямую определяет, какие модели ИИ могут быть разработаны и кто способен их создавать, формируя существенные барьеры для входа в отрасль.

Влияние на окружающую среду

Растущие вычислительные потребности систем ИИ несут значительные экологические издержки, включая существенное энергопотребление и выбросы углерода.

Уязвимости цепочек поставок

Вычислительные мощности ИИ зависят от сложных глобальных цепочек поставок с концентрированным производством и потенциальными едиными точками отказа.

Временной лаг политики

Современные политические рамки не поспевают за стремительным расширением вычислительной инфраструктуры для ИИ, создавая регуляторные пробелы.

Эффект аппаратной лотереи

Направления исследований в области искусственного интеллекта сильно зависят от доступного аппаратного обеспечения, при этом подходы, адаптированные к текущей вычислительной инфраструктуре, получают непропорционально большое внимание.

Геополитические последствия

Контроль над вычислительными ресурсами стал ключевым фактором в международной конкуренции, где экспортные ограничения и промышленная политика формируют доступ к возможностям искусственного интеллекта.

Содержание документа

Содержание отчета

1. Введение: центральная роль вычислительных ресурсов в ИИ

Вычислительная мощность стала фундаментальным фактором возможностей искусственного интеллекта. В отличие от предыдущих эпох, когда прогресс определялся алгоритмическими инновациями, современные достижения в области ИИ всё больше зависят от масштабных вычислительных ресурсов.

Этот сдвиг имеет глубокие последствия для того, кто может участвовать в передовых исследованиях ИИ, какие типы систем ИИ разрабатываются и как преимущества ИИ распределяются в обществе.

2. How Compute Demand Shapes AI Development

Растущие вычислительные требования передовых моделей ИИ создают значительные барьеры для входа, концентрируя возможности разработки в рамках хорошо финансируемых технологических компаний.

Эта вычислительная гонка вооружений влияет на приоритеты исследований, отдавая предпочтение подходам, которые масштабируются с ростом вычислительной мощности, в ущерб потенциально более эффективным, но менее требовательным к вычислениям методам.

  • Стартапы против Устоявшихся Компаний: Вычислительное преимущество крупных технологических компаний создает значительные конкурентные рвы
  • Направления Исследований: Вычислительно-емкие подходы получают непропорционально большое внимание и финансирование
  • Глобальное распределение: Вычислительные мощности распределены по миру неравномерно, что влияет на возможность участия регионов в развитии ИИ

3. Измерение вычислительной мощности в крупномасштабных моделях ИИ

Вычислительные требования для обучения AI обычно измеряются в операциях с плавающей запятой (FLOPs). Самые передовые современные модели требуют проведения тренировочных прогонов в диапазоне от 10^23 до 10^25 FLOPs.

Эти требования растут со скоростью, значительно опережающей улучшения эффективности оборудования, что приводит к экспоненциальному увеличению стоимости обучения передовых моделей.

4. AI Compute Hardware Stack

Экосистема аппаратного обеспечения ИИ включает специализированные процессоры, оптимизированные для параллельных вычислений, в частности графические процессоры (GPU) и всё более специализированные архитектуры, такие как TPU и другие ускорители искусственного интеллекта.

Различные аппаратные конфигурации оптимизированы для разных этапов жизненного цикла ИИ: обучения и вывода, обладая при этом distinct характеристиками производительности и эффективности.

5. Hardware Components and Supply Chains

Глобальная цепочка поставок для аппаратного обеспечения ИИ включает сложные взаимозависимости между проектированием, производством, сборкой и распределением со значительной географической концентрацией на каждом этапе.

  • Проектирование чипов: Доминирование компаний, таких как NVIDIA, AMD и Google
  • Производство: Сильно сконцентрировано на Тайване (TSMC) и в Южной Корее (Samsung)
  • Сборка и тестирование: В основном расположены в Восточной и Юго-Восточной Азии
  • Сырьевые материалы: Зависимость от специализированных материалов создает дополнительные уязвимости в цепочке поставок

6. Data Center Infrastructure

Центры обработки данных представляют физическую инфраструктуру, размещающую вычислительные ресурсы для обучения и развертывания ИИ. Их географическое распределение, источники энергии и системы охлаждения существенно влияют на экономику и экологический след AI-вычислений.

Крупные технологические компании все активнее разрабатывают специализированные центры обработки данных, оптимизированные specifically для рабочих нагрузок искусственного интеллекта, с особым вниманием к системам электропитания и охлаждения.

7. Environmental Impact and Sustainability

Вычислительная сложность современных систем искусственного интеллекта создает существенные экологические экстерналии, включая:

  • Значительное потребление электроэнергии как для обучения, так и для вывода
  • Использование воды для систем охлаждения в центрах обработки данных
  • Электронные отходы от обновления оборудования
  • Выбросы углерода при генерации энергии

Меры по смягчению этих воздействий включают повышение вычислительной эффективности, размещение центров обработки данных в регионах с возобновляемыми источниками энергии и разработку более устойчивых технологий охлаждения.

8. Policy Responses and Governance

Современные политические рамки с трудом успевают за стремительным расширением вычислительной инфраструктуры для ИИ. Ключевые аспекты политики включают:

  • Экологические нормы, регулирующие выбросы и энергопотребление центров обработки данных
  • Антимонопольные аспекты, связанные с концентрацией вычислительных ресурсов
  • Экспортный контроль на передовое вычислительное оборудование
  • Стандарты измерения и отчетности по вычислительной эффективности
  • Государственные инвестиции в вычислительную инфраструктуру для исследований

9. Выводы и перспективные направления

Вычислительная мощность стала ключевым фактором, определяющим развитие и внедрение искусственного интеллекта. Растущие вычислительные потребности создают значительные барьеры для входа, экологические проблемы и уязвимости в цепочках поставок.

Решение этих проблем требует скоординированных действий, включая технические усовершенствования в области эффективности, меры политики для управления внешними эффектами и структурные подходы для обеспечения более широкого доступа к вычислительным ресурсам.

Будущие исследования должны быть сосредоточены на разработке менее ресурсоемких методов ИИ, усовершенствовании измерений вычислительной эффективности и создании механизмов управления для распределения и доступа к вычислительным мощностям.