모바일 플랫폼이 네이티브 AI와 가벼운 창의적 애플리케이션으로 점점 기울어지고 있는 현시점, 인텔은 최근 그래픽 드라이버에 혁신적인 "공유 GPU 메모리 재지정" 기능을 선보였습니다. 이 향상된 기능은 일부 Core Ultra 모델의 내장형 Arc GPU에 시스템 메모리 비율을 보다 많이 할당할 수 있게 해줍니다. 사용자는 인텔 그래픽 소프트웨어 내 슬라이더를 활용하여 이 기능을 조정, iGPU에서 사용할 수 있는 최대 메모리를 증대할 수 있습니다. 초기 기본 할당률은 약 57%로 나타나지만, 인텔의 공식 데모에서는 고메모리 노트북 경우 실제로 87%까지 증가할 수 있음을 보여줬습니다. 이 발전은 메모리가 적은 경우 AI 모델을 로컬로 실행하는 데 있어 개발자 및 고급 사용자에게 보다 유연한 환경을 제공하는 것을 목표로 합니다.

이 개념은 통합 메모리 아키텍처(UMA)를 기반으로 합니다. 통합 GPU는 독립된 비디오 메모리가 아닌 통합된 시스템 메모리를 활용합니다. 기존 전략은 주로 DVMT 예약 및 동적 BIOS 할당에 의존하는 경우가 많았지만, 인텔은 이제 드라이버 레벨에서 사용자가 조정 가능한 백분율 할당을 도입했습니다. 이 기능을 통해 iGPU가 최대 사용 중 "대여" 받을 수 있는 시스템 메모리 풀을 효과적으로 확장할 수 있습니다. 이 기능을 활성화하기 위해서는 시스템을 재부팅하고 최신 드라이버 버전을 설치해야 하며, 특정 플랫폼 요구 사항과 최소 메모리 사양을 충족해야 합니다. 일부 OEM은 BIOS에서 유사한 선택 옵션을 제공할 수 있습니다. 이 점에서 주목해야 할 것은 이 기능은 메모리 하위 시스템의 대역폭이나 지연 시간을 개선하는 것이 아니라 "용량 상한"을 늘리는 것입니다. CPU와 GPU는 여전히 시스템 버스 및 메모리 컨트롤러를 공유합니다.
텍스처와 리소스를 많이 소비하는 시나리오에서 캡을 확장하면 빈번한 컨텍스트 전환 방지 및 용량 부족으로 인한 지연을 감소시킬 수 있습니다. 그러나 메모리 가용성이 증가한 후 애플리케이션이 더 높은 사양의 리소스를 로드하기 시작하면 이점이 상쇄되거나 부담이 증가할 수 있습니다. 이러한 현상은 VRAM 가용성이 증가함에 따라 특정 엔진에서 더 높은 해상도 텍스처를 로드하거나 캐시 큐를 확장하는 게임에서도 발생할 수 있으며, 이는 프레임률을 향상시키지 않고도 프레임 지연 변동을 증가시킬 수 있습니다. 용량 완화에도 불구하고 대역폭 제약은 여전히 존재하며, 특히 LPDDR 5/5X를 사용하는 얇고 가벼운 플랫폼의 경우 128비트 버스 속도가 약 7.5Gbps ~ 8.5Gbps에서 약 100GB/s의 이론적 대역폭 제한을 나타냅니다. CPU와 GPU 간의 메모리 경쟁은 "더 큰 풀"의 존재만으로는 해결되지 않습니다.
비게임 컨텍스트에서는 용량이 주요한 제한 요소로 작용합니다. 이미지 생성, 비디오 처리 및 과학적 시각화, 로컬 LLM/다중 모달 모델 실행 등은 중간 활성화와 무거운 가중치의 제약을 받습니다. 확장된 iGPU 메모리 캡을 통해 더 큰 모델 또는 고해상도 데이터 세트를 수용할 수 있어 보통 클라우드 리소스를 요구하는 오프라인 처리가 가능해집니다. 그러나 실행 속도는 여전히 컴퓨팅 파워, 매트릭스 명령 가속 및 소프트웨어 스택의 기능에 의존합니다. OpenVINO, oneAPI 같은 프레임워크와 전략은 차별적인 성능 차이를 나타냅니다. 충분한 메모리는 단순히 "실행할 수 있는" 전제조건일 뿐, "더 빠른" 수행능력을 보장하지는 않습니다.

AMD 역시 Ryzen AI 플랫폼을 통해 가변 그래픽 메모리 할당을 허용, iGPU에 시스템 메모리를 동적으로 할당하고, AFMF와 같은 드라이버 수준의 성능 향상 기능과 통합을 실시했습니다. 양사의 접근 공통점은 UMA를 사용해 보다 유연하게 그래픽 메모리 풀을 확장하는 점입니다. 그러나 이러한 유연성이 전체 성능 향상으로 이어지는 것은 아닙니다. 이득은 특정 워크로드에 따른 자원 관리, 엔진 스케줄링 및 대역폭 지연의 역학에 의해 좌우됩니다.
이 설정을 구성하려면 메모리 용량과 시스템 가용성 간의 균형을 맞춰야 합니다. 비율이 높아지면 OS 및 상주 애플리케이션에 할당되는 물리적 메모리가 줄어들어 집중적인 백그라운드 작업 중 스왑 발생 가능성이 높아지고, 이는 전체 시스템 성능에 영향을 미칠 수 있습니다. 이러한 조정은 32GB 또는 64GB RAM 시스템에 적합하며, 16GB 경우 작업 필요에 따라 점진적 조정이 필요합니다. 작업 관리자 또는 드라이버 패널을 통해 메모리 사용량 변화를 모니터링해야 하며 메모리 부족 또는 전환 속도가 느려질 때 비율을 적시에 조정해야 합니다. 특정 모델 수준 제한이 있을 수 있으므로 장치 설명서 또는 BIOS 옵션을 참조해야 합니다.
이 기능은 펌웨어 수준 메모리 할당 제어를 시스템 차원으로 향상시켜 그래픽 제어판을 통해 접근 가능하며, 비용을 절감할 수 있습니다. 사용자의 경우 용량 관리 영역 내의 메모리 부족 문제를 해결하는 데 도움을 줍니다. 그러나 개발자는 리소스 검색 및 품질 계층화를 개선하여 비효율적 이득이 일어나지 않도록 해야 합니다. 결론적으로, iGPU 메모리 상한을 적절히 늘리면 콘텐츠 생성 및 로컬 AI 컨텍스트에서 작업 완성도를 높일 수 있으며, 게임 시나리오에서는 특정 엔진 설정, 해상도, 재료 사양에 따라 프레임레이트 경험에 미치는 이점을 확인해야 합니다. 이는 일반적인 가속 전환기가 아닌, 조정 가능한 도구로 사용해야 합니다.