ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 온칩 AI 통합은 PC 컴퓨팅의 미래입니다
    IT 소식 2023. 10. 6. 14:13
    728x90

    2023년 1월, AMD는 AMD 통합 Ryzen AI 엔진을 탑재한 엄선된 Ryzen™ 7040 모바일 시리즈 프로세서를 공개했습니다. 이 전용 엔진은 AMD XDNA™ 아키텍처를 사용하여 구축되었으며 클라우드로 데이터를 전송하는 것과 비교하여 더 낮은 대기 시간, 더 나은 배터리 수명 및 AI 워크로드 실행을 위한 안전한 환경을 제공하도록 설계되었습니다. Ryzen AI의 출시는 x86 프로세서로서는 최초이자 컴퓨팅의 미래에 대한 투자였지만, 애초에 AI 엔진을 통합하는 이유는 무엇일까요?

     

    기업과 일반 대중이 ChatGPT, Stable Diffusion 및 기타 생성 AI의 기능을 확인하면서 지난 한 해 동안 AI에 대한 관심이 폭발적으로 증가했습니다. AI 배포는 초기 단계이지만 Microsoft, Google, Adobe와 같은 기업이 해당 분야에 진출하면서 해당 분야가 빠르게 성숙해지고 있습니다.

     

    컴퓨팅 업계에서는 이전에도 연구실과 슈퍼컴퓨팅 환경에서 개인용 컴퓨팅 장치로 워크로드가 이동하는 것을 보아 왔습니다. 소비자 CPU에 부동 소수점 장치(FPU)를 포함시키는 것과 저렴한 소비자 3D 그래픽 카드의 출현은 모두 이러한 유형의 마이그레이션의 예입니다. 역사적으로 이러한 신기술의 통합은 종종 예상치 못한 방식으로 높은 성장을 가져왔습니다.

     

    1990년대 초 CPU 제조업체가 온다이 부동 소수점 보조 프로세서를 추가하기 전에는 Doom과 같은 게임이 고정 소수점 연산을 사용하는 것으로 찬사를 받았습니다. FPU의 폭넓은 가용성으로 인해 훨씬 ​​더 나은 시각적 품질과 더 높은 프레임 속도를 제공함으로써 불과 몇 년 만에 Quake와 같은 완전한 3D 게임으로의 도약이 가능해졌습니다.

     

    동일한 발전으로 $50,000 워크스테이션에서 $5,000 PC까지 정교한 파라메트릭 CAD 응용 프로그램의 생산성 이점을 가져왔고, 더 많은 기업이 이 기술을 저렴하게 사용할 수 있게 함으로써 대중화되었습니다. 시간이 지남에 따라 CPU에 AVX SIMD 명령어를 추가하면 부동 소수점 컴퓨팅 성능이 극적으로 향상되어 현재 헐리우드 영화에서 볼 수 있는 광선 추적 렌더링 및 이미지가 가능해졌습니다.

     

    기술이 어떻게 예상치 못한 방식으로 성장을 주도했는지 보여주는 또 다른 예는 최초의 소비자용 3D 그래픽 카드의 도입입니다. 이러한 장치는 3D 개체를 표시하기 위해 음영 처리되고 질감이 있는 삼각형을 그리는 데 즉시 적용할 수 있습니다. 게임 산업이 이러한 초기 그래픽 카드에 대한 성능 요구를 높이면서 장치 제조업체는 제한된 프로그래밍 기능을 추가하기 시작했고 마침내 오늘날의 범용 SIMD 컴퓨팅 엔진으로 전환했습니다. 이러한 동일한 GPU 엔진은 고정밀 64비트 부동 소수점 기능을 추가했으며 최근 정밀도가 낮은 데이터 유형에서도 잘 작동하는 AI 모델로 전환하기 전에 시뮬레이션 및 과학 분석 애플리케이션에 채택되었습니다.

     

    이러한 모든 경우에서 기술 채택이 증가하고 가속기의 성능이 향상됨에 따라 소비자 및 상업용 새로운 사용 사례가 나타났습니다. AI도 비슷한 도약을 준비하고 있다. 일부 Ryzen 7040 시리즈 프로세서는 전용 AI 엔진의 추가 컴퓨팅 성능과 고유한 기능을 높이 평가하지만 보다 일반적인 처리에 최적화된 소프트웨어에 대한 지원도 필요로 하는 얼리 어답터의 처리 요구 사항을 지원하도록 설계되었습니다.

     

    올바른 작업을 위한 올바른 도구

     

    Ryzen AI에는 프로세서의 다양한 컴퓨팅 엔진에서 AI 워크로드를 실행하는 기능이 포함되어 있습니다. 실행을 위한 최상의 경로는 작업 유형, 소프트웨어 지원, 모델 최적화 및 시스템에 있는 각 컴퓨팅 엔진의 상대적인 기능에 따라 달라집니다. Ryzen 7040 모바일 시리즈 프로세서는 최고의 CPU, GPU 및 AMD XNDA 아키텍처 기반 컴퓨팅 기능의 유연성을 제공한다는 점에서 동급에서 독특합니다. 이는 AI 워크로드가 시간이 지남에 따라 발전하더라도 개발자와 최종 사용자에게 워크로드 실행에 있어 전례 없는 유연성을 제공합니다.

     

    CPU 대 AMD XDNA 아키텍처 실행

     

    Ryzen 7040 프로세서는 AVX-512 ISA(Instruction Set Architecture) 확장에 대한 지원을 포함하는 "Zen 4" 기반 CPU 코어를 갖추고 있습니다. 이 특수 명령어 세트를 통해 CPU는 지원되는 애플리케이션에서 AI 워크로드를 훨씬 더 빠르게 실행할 수 있습니다. CPU는 일반적으로 AI 모델 교육에 사용되지 않지만 특정 추론 워크로드에서 우수한 성능을 발휘할 수 있습니다. AVX-512는 애플리케이션에서 지원될 때 추가적인 이점을 제공합니다. "Zen 4" 아키텍처는 AI 워크로드 처리를 위한 몇 가지 고유한 기능을 제공하지만 AMD XDNA AI 엔진에는 여전히 아키텍처상의 이점이 있습니다.

     

     

    위 이미지의 왼쪽에는 개별 캐시와 공유 캐시가 혼합된 기존 멀티 코어 CPU와 메인 메모리에 대한 CPU 링크가 나와 있습니다. 오른쪽은 AMD XDNA AI 엔진의 블록 다이어그램과 근본적으로 다른 메모리 계층 구조를 보여줍니다.

     

    기존 CPU는 개인 캐시와 공유 캐시를 혼합하여 메모리 액세스 대기 시간을 줄이고 성능을 향상시킵니다. CPU 코어 간의 통신은 공유 상호 연결 또는 공유 캐시를 통해 처리됩니다. 이러한 배열은 CPU가 뛰어난 작업 부하 유형을 실행할 때 잘 작동하지만 AI 엔진에 가장 적합한 솔루션은 아닙니다. AI 엔진은 결정론적으로 메모리 작업을 예약할 수 있을 때 최적으로 실행되지만 일반적인 CPU의 메모리 대기 시간은 정보가 캐시 내에서 발견되는지 또는 칩이 주 메모리에서 정보를 검색해야 하는지에 따라 달라집니다.

     

    GPU 대 AMD XDNA 아키텍처 실행

     

    최근에는 프로그래밍 가능한 셰이더 아키텍처, 높은 수준의 병렬 처리 및 효율적인 부동 소수점 컴퓨팅 기능으로 인해 GPU가 AI 워크로드 실행을 위해 선택되는 컴퓨팅 엔진이 되었습니다. Ryzen 7040 시리즈 프로세서에는 AI 워크로드를 실행하기 위한 또 다른 강력한 엔진을 제공하는 AMD RDNA™3 기반 그래픽 프로세서도 포함되어 있습니다.

     

    많은 AI 워크로드에서 GPU는 CPU가 제공할 수 있는 것보다 더 높은 성능을 제공할 수 있습니다. 그러나 GPU에도 AI 처리 전용 하드웨어에 비해 최적화가 덜 되는 제한 사항이 있을 수 있습니다. 여기에는 AI 코드를 실행할 때 사용되지 않는 3D 렌더링에 필수적인 하드웨어 블록이 포함되어 있어 잠재적으로 전용 가속기보다 효율성이 떨어질 수 있습니다. 또한 GPU는 수백 또는 수천 개의 코어에서 작업을 실행하는 데 중점을 둡니다. 이들은 자체적인 정교한 메모리 아키텍처(위에 표시되지 않음)를 사용하고 그래픽 워크로드의 본질적인 병렬성을 활용하여 캐시 누락을 숨깁니다. 이러한 기능은 그래픽 렌더링에 매우 중요하지만 AI 프로세서의 성능을 반드시 향상시키는 것은 아닙니다.

     

     

     

    위 이미지는 왼쪽의 전형적인 신경망과 오른쪽의 AMD Ryzen AI 엔진의 핵심인 AMD XDNA 적응형 데이터 흐름 아키텍처를 보여줍니다. L1에서 L6까지의 연결은 인간 두뇌에서 뉴런이 연결되는 방식을 시뮬레이션합니다. Ryzen AI 엔진은 유연하고 워크로드의 기본 특성에 따라 리소스를 다르게 할당할 수 있지만 위의 예는 개념 증명으로 작동합니다.

    각 신경 계층이 새 값을 다음 뉴런에 전달하기 전에 들어오는 데이터에 대해 행렬 곱셈 또는 컨볼루션 작업을 수행하는 워크로드를 상상해 보십시오. AMD XDNA 아키텍처는 크고 전력 소모가 크며 값비싼 캐시가 필요 없이 컴퓨팅 어레이에서 컴퓨팅 어레이로 데이터를 이동하도록 설계된 데이터 흐름 아키텍처입니다. 데이터 흐름 아키텍처의 목표 중 하나는 애초에 캐시가 필요하지 않음으로써 캐시 누락으로 인한 예상치 못한 대기 시간을 방지하는 것입니다. 이러한 유형의 디자인은 CPU 스타일 캐시에서 데이터를 가져오는 동안 대기 시간 저하 없이 고성능을 강조합니다. 또한 대용량 캐시와 관련된 전력 소비 증가를 방지합니다.

     

    AMD XDNA 아키텍처에서 AI 실행의 이점

     

    고성능 CPU 및 GPU 기술은 AMD의 장기 AI 전략의 중요한 기둥이지만 AI 엔진 온다이 통합만큼 혁신적이지는 않습니다. 오늘날 AI 엔진은 이미 CPU와 GPU의 특정 처리 작업을 오프로드하는 데 사용되고 있습니다. 배경 흐림, 얼굴 감지, 소음 제거와 같은 이동 작업은 모두 전용 AI 엔진에서 보다 효율적으로 수행할 수 있는 작업으로, CPU 및 GPU 사이클을 다른 작업에 할당하는 동시에 전력 효율성을 향상시키는 데 도움이 됩니다.

     

    AI를 APU에 통합하면 몇 가지 장점이 있습니다. 첫째, PCIe® 버스를 통해 장치를 연결하는 것에 비해 대기 시간이 줄어들고 성능이 향상되는 경향이 있습니다. AI 엔진이 칩에 통합되면 메모리에 대한 공유 액세스의 이점을 얻을 수 있으며 보다 최적의 데이터 이동을 통해 효율성이 향상됩니다. 마지막으로, 실리콘을 다이에 통합하면 새로운 프로세서 블록에 고급 전력 관리 기술을 더 쉽게 적용할 수 있습니다.

     

    PCI Express® 슬롯 또는 M.2 슬롯을 통해 연결된 외부 AI 엔진은 확실히 가능하지만 이 기능을 가장 진보된 "Zen 4" 및 AMD RDNA™ 3 실리콘에 통합하는 것이 고객에게 제공하는 더 나은 방법이었습니다. 위의 장점을 희생하지 않고. 이 로컬 프로세서를 활용하는 애플리케이션은 더 빠른 응답 시간과 더 일관된 성능의 이점을 누릴 수 있습니다.

     

    지금은 AI 개발이 흥미로운 시기입니다. 오늘날 고객, 기업 및 제조업체는 모든 수준과 전력 한계에서 AI를 평가하고 있습니다. 이 진화하는 공간에서 유일하게 확실한 것은 5~7년을 내다볼 수 있다면 오늘날 ChatGPT, Stable Diffusion 또는 Midjourney가 수행하는 것과 동일한 작업에서 더 나은 작업을 수행하는 모델을 "단순히" 볼 수는 없다는 것입니다. 아직 누구도 생각하지 못한 AI 모델과 애플리케이션이 나올 것입니다. AMD가 Ryzen 7040 모바일 시리즈 프로세서의 일부 프로세서에 통합한 AI 성능 향상은 개발자와 최종 사용자에게 실험, 평가 및 궁극적으로 미래를 실현하는 데 필요한 유연성과 지원을 제공합니다.

     

    1. Ryzen™ AI 기술은 Ryzen 5 7540U 및 Ryzen 3 7440U를 제외한 모든 AMD Ryzen 7040 시리즈 프로세서와 호환됩니다. OEM 활성화가 필요합니다. 구매하기 전에 시스템 제조업체에 기능 가용성을 확인하십시오. GD-220.

    여기에서 제3자 상표, 로고, 제품, 서비스 또는 솔루션을 사용하거나 언급하는 것은 정보 제공의 목적으로만 제공되며 AMD의 보증을 의도하거나 암시하는 것은 아닙니다. GD-83.

     

    출처 : https://community.amd.com/t5/ai/on-chip-ai-integration-is-the-future-of-pc-computing/ba-p/634067

     

    #amd #xdna #ryzenAI #ai

Designed by Tistory.