컴퓨팅 파워와 인공지능

AI 발전에서 컴퓨팅의 역할, 인프라 수요 및 정책적 함의에 대한 종합적 분석

By Jai Vipra & Sarah Myers West | AI Now Institute

게시: 2023년 9월

리포트 개요

본 보고서는 인공지능 시스템에서 컴퓨팅 파워(compute)의 중요한 역할을 분석한다. AI 모델의 규모와 복잡성이 증가함에 따라, 컴퓨팅 요구사항이 전례 없는 속도로 증가하면서 기술, 환경, 경제, 정책 등 다양한 영역에서 새로운 도전과 함의를 창출하고 있다.

우리는 하드웨어 구성 요소부터 데이터 센터에 이르는 컴퓨테이셔널 인프라의 전체 스택을 분석하고, 컴퓨팅 제약과 할당이 AI 개발 방향, 참여 주체, 그리고 구축되는 AI 시스템의 유형을 어떻게 형성하는지 탐구합니다.

주요 데이터 포인트

컴퓨팅 수요 증가

2012년 이후 대규모 AI 모델 훈련에 필요한 컴퓨팅 요구량이 3-4개월마다 두 배씩 증가하며 무어의 법칙을 훨씬 앞지르고 있다

에너지 소비

단일 대규모 언어 모델 훈련에는 미국 가정 100여 가구의 연간 에너지 사용량에 상당하는 전력이 소모될 수 있습니다.

시장 집중도

AI 훈련 인프라를 제공하는 클라우드 컴퓨팅 시장의 65% 이상을 단 3개 기업이 장악하고 있습니다.

Carbon Footprint

AI 부문의 연산 수요는 2025년까지 전 세계 전력 소비의 최대 3%를 차지할 수 있습니다.

핵심 인사이트 요약

컴퓨팅은 AI 역량을 정의한다

컴퓨팅 자원의 규모는 어떤 종류의 AI 모델을 개발할 수 있는지, 누가 개발할 수 있는지를 직접적으로 결정하며, 진입 장벽을 크게 형성합니다.

Environmental Impact

AI 시스템의 증가하는 컴퓨팅 수요는 상당한 에너지 소비와 탄소 배출을 포함한 막대한 환경 비용을 수반합니다.

공급망 취약성

AI 연산 능력은 집중된 생산 체계와 잠재적 단일 장애점을 지닌 복잡한 글로벌 공급망에 의존합니다.

정책 시차

현행 정책 체계는 AI 연산 인프라의 급속한 확장을 따라가지 못해 규제 공백이 발생하고 있습니다.

하드웨어 복권 효과

AI 연구 방향은 가용 하드웨어의 영향을 크게 받으며, 현재의 컴퓨팅 인프라에 적합한 접근법이 지나친 관심을 받는 경향이 있습니다.

지정학적 함의(Geopolitical Implications)

컴퓨팅 자원에 대한 통제는 국제 경쟁의 핵심 요소가 되었으며, 수출 통제와 산업 정책이 AI 역량에 대한 접근을 형성하고 있습니다.

Document Contents

보고서 내용

1. 서론: AI에서 컴퓨팅의 중심적 역할

컴퓨팅 파워는 AI 능력의 근본적인 결정 요인이 되었습니다. 알고리즘 혁신이 발전을 주도했던 이전 시대와 달리, 현대 AI의 진보는 점점 더 방대한 컴퓨팅 자원에 의존하고 있습니다.

이러한 변화는 누가 최첨단 AI 연구에 참여할 수 있는지, 어떤 종류의 AI 시스템이 개발되는지, 그리고 AI의 혜택이 사회 전반에 어떻게 분배되는지에 대해 깊은 함의를 지닙니다.

2. How Compute Demand Shapes AI Development

최첨단 AI 모델에 대한 컴퓨팅 요구사항이 점차 증가하며 진입 장벽을 크게 높이고, 자원이 풍부한 기술 기업들 사이로 개발 역량이 집중되고 있습니다.

이러한 컴퓨팅 경쟁은 연구 우선순위에 영향을 미쳐, 잠재적으로 더 효율적이지만 컴퓨팅 집약도가 낮은 방법보다 컴퓨팅 규모에 따라 확장되는 접근법을 선호하게 합니다.

  • 스타트업 대 기존 기업: 대형 기술 기업들의 컴퓨팅 우위는 상당한 경쟁적 해자를 형성한다
  • 연구 방향: 컴퓨팅 집약적 접근법은 지나친 관심과 자금을 받는 경향이 있습니다
  • 글로벌 분포: 컴퓨팅 능력은 전 세계적으로 불균등하게 분포되어 있어 AI 개발에 참여할 수 있는 지역에 영향을 미칩니다

3. 대규모 AI 모델에서의 컴퓨팅 측정

AI 훈련의 컴퓨팅 요구사항은 일반적으로 플롭스(FLOPs)로 측정됩니다. 최신 최첨단 모델들은 10^23~10^25 FLOPs 범위의 훈련 실행을 필요로 합니다.

이러한 요구사항은 하드웨어 효율성 향상 속도를 훨씬 초과하는 속도로 증가하여 최신 최고 수준 모델 훈련 비용이 기하급수적으로 증가하는 결과를 초래하고 있습니다.

4. AI 컴퓨팅 하드웨어 스택

AI 하드웨어 생태계에는 병렬 컴퓨팅에 최적화된 특수 프로세서, 특히 GPU와 TPU 및 기타 AI 가속기와 같은 도메인 특화 아키텍처가 포함됩니다.

서로 다른 하드웨어 구성은 AI 라이프사이클의 학습과 추론 단계에 따라 각각 최적화되어 뚜렷한 성능 및 효율성 특성을 나타냅니다.

5. Hardware Components and Supply Chains

AI 하드웨어의 글로벌 공급망은 설계, 제조, 조립, 유통에 걸쳐 복잡한 상호의존성을 가지며, 각 단계마다 지리적 집중 현상이 뚜렷하게 나타난다.

  • 칩 설계: NVIDIA, AMD, Google과 같은 기업이 주도함
  • 제조: 대만(TSMC)과 한국(삼성)에 집중되어 있음
  • 어셈블리 및 테스트: 주로 동아시아 및 동남아시아에 위치
  • 원자재: 전문 소재에 대한 의존도는 공급망의 추가적인 취약점을 생성함

6. 데이터 센터 인프라

데이터 센터는 AI 훈련 및 배치를 위한 계산 자원을 수용하는 물리적 인프라를 나타냅니다. 이들의 지리적 분포, 에너지원 및 냉각 시스템은 AI 컴퓨팅의 경제성과 환경 발자국에 중대한 영향을 미칩니다.

주요 기술 기업들은 AI 워크로드에 특화된 데이터 센터를 점점 더 개발하고 있으며, 특히 전력 공급 및 냉각 시스템에 주의를 기울이고 있습니다.

7. Environmental Impact and Sustainability

현대 AI 시스템의 연산 집약도는 상당한 환경 외부효과를 발생시킵니다. 여기에는 다음과 같은 요소들이 포함됩니다:

  • 훈련(training)과 추론(inference) 과정에서의 상당한 전력 소비
  • 데이터 센터 냉각 시스템을 위한 수자원 사용
  • 하드웨어 교체로 인한 전자 폐기물
  • 에너지 생산 과정의 탄소 배출

이러한 영향력을 완화하기 위한 노력에는 계산 효율성 향상, 재생 에너지가 풍부한 지역에 데이터 센터를 위치시키는 것, 그리고 더욱 지속 가능한 냉각 기술을 개발하는 것이 포함됩니다.

8. Policy Responses and Governance

현재 정책 프레임워크는 AI를 위한 계산 인프라의 급속한 확장을 따라가는 데 어려움을 겪고 있습니다. 주요 정책 고려 사항은 다음과 같습니다:

  • 데이터센터 배출량 및 에너지 사용에 관한 환경 규제
  • 집중된 컴퓨팅 자원에 관한 반독점적 고려사항
  • 첨단 컴퓨팅 하드웨어 수출 통제
  • 계산 효율성 측정 및 보고 기준
  • 연구용 컴퓨팅 인프라에 대한 공공 투자

9. 결론 및 향후 방향

컴퓨팅 파워는 인공지능의 개발과 배포를 결정하는 핵심 요소로 부상했습니다. 점차 증가하는 컴퓨팅 요구사항은 진입 장벽, 환경 문제, 공급망 취약성 등 중요한 과제를 야기하고 있습니다.

이러한 과제를 해결하기 위해서는 효율성 향상을 위한 기술적 개선, 외부 효과 관리를 위한 정책 대응, 컴퓨팅 자원에 대한 보다 광범위한 접근을 보장하기 위한 구조적 접근 방식 간의 조정된 조치가 필요합니다.

향후 연구는 계산 집약도가 낮은 AI 방법 개발, 계산 효율성 측정 개선, 컴퓨팅 자원 할당 및 접근을 위한 거버넌스 메커니즘 설계에 중점을 두어야 합니다.