중앙처리장치(CPU)와 그래픽처리장치(GPU)가 수퍼컴퓨터, 인공지능, 자율주행차 등 차세대 컴퓨터 시스템의 ‘두뇌’ 자리를 놓고 뜨거운 경쟁을 펼치고 있다. 전통적으로 컴퓨터의 두뇌 역할은 CPU가 맡아왔다. 하지만 빅데이터, 3차원(3D) 그래픽 등 정보량이 늘면서 GPU가 주목받고 있다.

전문가들은 고성능 컴퓨터 시스템을 구축할 때 성능, 가격, 효율 등 여러 요소를 감안해 CPU와 GPU의 적절한 조합이 중요하다고 강조한다. 지난 3월 이세돌 9단과 바둑대결을 펼친 구글의 인공지능 시스템 '알파고(AlphaGo)'가 대표적인 사례다. 알파고는 1920개의 CPU와 280개의 GPU의 조합으로 이뤄져 있다.

◆ CPU와 GPU의 차이는?

CPU와 GPU는 둘 다 데이터를 읽어들여 연산처리를 통해 답을 도출하는 기능을 수행한다. 컴퓨터에서 두뇌 역할을 하는 점에서 비슷하다. 하지만 프로세서 내부의 구조를 살펴보면 CPU와 GPU의 차이는 크다.

CPU·GPU와 같은 프로세서 내부는 크게 연산을 담당하는 산출연산처리장치(ALU)와 명령어를 해석·실행하는 컨트롤유닛(CU), 각종 데이터를 담아두는 캐시로 나뉜다. CPU는 명령어가 입력된 순서대로 데이터를 처리하는 직렬(순차) 처리 방식에 특화된 구조를 가지고 있다. 한 번에 한 가지의 명령어만 처리한다. 따라서 연산을 담당하는 ALU의 개수가 많을 필요가 없다. 최근 출시된 옥타(8)코어 CPU에는 코어 당 1개씩, 총 8개의 ALU가 탑재돼 있다.

CPU 내부 면적의 절반 이상은 캐시 메모리로 채워져 있다. 캐시 메모리는 CPU와 램(RAM)과의 속도차이로 발행하는 병목현상을 막기 위한 장치다. CPU가 처리할 데이터를 미리 RAM에서 불러와 CPU 내부 캐시 메모리에 임시로 저장해 처리 속도를 높일 수 있다. CPU가 단일 명령어를 빠르게 처리할 수 있는 비결도 이 때문이다.

반대로 GPU는 여러 명령어를 동시에 처리하는 병렬 처리 방식을 가지고 있다. 캐시 메모리 비중이 크지 않고 연산을 할 수 있는 ALU 개수가 많다. 1개의 코어에는 수백, 수천개의 ALU가 장착돼 있다.

CPU업계 관계자는 “옥타코어 CPU는 속도가 빠른 8대의 비행기로 짐을 실어 나르는 것에 비유할 수 있고, GPU는 속도는 느리지만 1000대의 기차로 짐을 실어나르는 것에 비유할 수 있다”며 “처리해야 할 명령어와 데이터의 성격에 따라 때로는 CPU, 때로는 GPU가 빠를 수가 있다”고 말했다.

컴퓨터는 데이터를 디지털인 0, 1의 수로 구분하여 저장하는데, 간단한 정수 외의 실생활에서 널리 사용되는 실수를 디지털로 저장하기 위해 고정소수점 혹은 부동소수점이라는 데이터 저장방식을 활용한다.

고정소수점은 10비트(bit)를 기준으로 0~1023까지 총 1024개의 숫자를 표현할 수 있다. 하지만 부동소수점은 2bit로 자릿수를 표현해 최대 25만5000개의 숫자 표현이 가능하다. 같은 비트임에도 부동소수점이 고정소수점에 비해 정밀한 표현이 가능한 셈이다. 또 고정소수점은 더하기, 빼기 연산을 빨리 수행할 수 있고, 부동소수점은 그래픽, 음성 등 멀티미디어 데이터를 상대적으로 빨리 처리할 수 있다.

CPU 제조사들은 정수나 고정소수점 데이터를 많이 사용하는 인터넷 서핑, 문서 작성 등 일상생활의 작업을 보다 빠르게 수행하도록 설계한다. 반면 GPU 제조사들은 CPU로는 시간이 많이 걸리는 멀티미디어, 특히 3차원 그래픽과 사운드를 잘 수행하도록 칩을 만든다.

세계 최대 GPU 제조사인 엔비디아의 이선희 상무는 “현재 웬만한 게임은 CPU만 가지고는 실행 자체가 불가능하며 GPU가 반드시 필요하다”며 “특히 GPU는 대용량 부동소수점 데이터도 병렬 고속처리를 통해 간단하게 계산할 수 있다”고 설명했다.

◆ GPU 1위 엔비디아, 복잡한 계산 시장에 뛰어들다

2000년 후반부터 GPU 진영이 그래픽 처리 분야를 넘어 고도의 계산을 요하는 수퍼컴 분야까지 속속 진출하게 된다. 이른바 GPU를 이용한 범용연산 기술 (GPGPU·General-Purpose computing on Graphics Processing Units)이 각광받기 시작한 것이다. GPU를 병령 컴퓨터의 대량 계산에 활용해봤더니 연산속도가 획기적으로 높아진 것이다. 오늘날 수퍼컴은 엄청난 숫자의 CPU를 병렬로 연결해 복잡한 계산을 수행하기 때문에 병렬 처리에 강한 GPU를 사용하면 계산속도가 빨라진다.

문병로 서울대 컴퓨터학과 교수는 “투입비용과 전력효율을 고려해 GPU를 수퍼컴퓨터에 추가하는 사례가 크게 늘었다”고 말했다.

CPU업계 1위는 인텔, GPU 업계 1위는 엔비디아다. 엔비디아가 그래픽 처리 분야를 넘어 복잡한 계산을 요하는 수퍼컴 분야까지 진출하자 인텔이 엔비디아를 견제하기 시작했다. 엔지니어들이 ‘CPU-GPU 전쟁(CPU-GPU debate)’이라고 불렀던 인텔과 엔비디아 간 소송이 벌어진 것이다.

2009년 인텔은 네할렘 프로세서를 출시하면서 엔비디아가 인텔 CPU에 엔비디아 GPU를 통합한 칩셋을 통합해 출시하는 것은 저작권 위반이라고 소송을 제기했고. 엔비디아는 2004년 두 회사가 맺은 크로스 라이선스 계약을 인텔이 무시하는 처사라며 맞소송에 나섰다. 두 회사의 소송은 2011년 양측 합의로 종결됐지만, CPU와 GPU의 전쟁은 여전히 '현재진행형'이다.
.

엔비디아는 지난 1월 미국 소비자가전쇼(CES)에서 ‘드라이브PX2’ 시스템을 공개했다. 이 시스템에는 2개의 차세대 테그라(Tegra) 프로세서와 파스칼(Pascal) 아키텍처 기반 GPU 두 개를 탑재해 1초에 최대 24조 회에 달하는 작업을 처리할 수 있다. 예상하지 않은 도로 위의 파편이나 다른 운전자의 돌발 행동, 공사 중인 도로와 같은 예외적인 상황도 빠르게 인식해 최적의 판단을 빠르게 내릴 수 있는 식이다.

GPU에도 한계점이 있다. GPU가 최대 성능을 발휘하기 위해서는 모든 계산을 병렬로 처리할 수 있도록 사전에 알고리즘을 바꿔줘야 한다. 알고리즘 자체가 병렬화되지 않는다면 CPU 한 개를 사용하는 것보다 느릴 수 있다.

또 계산의 밀도에 따라 성능 결과는 달라질 수 있다. 예를 들어, 100메가바이트(MB) 용량의 이미지 한장을 컴퓨터에 저장할 때 컴퓨터는 이미지를 보조저장장치인 하드디스크드라이브(HDD)에 넣으라는 명령(계산)을 한차례 내린다. 이미지 용량은 크지만, 계산을 한 번 하는 경우 CPU의 처리속도가 더 빠르다.

이와는 달리 1MB 이미지 100장을 컴퓨터에 저장한다고 했을 때 컴퓨터는 총 100번의 계산을 하게 된다. 용량은 적지만 100번의 명령이 필요한 1MB 이미지 처리의 경우 GPU가 더 빠를 수 있다.

◆ CPU 1위 인텔, CPU와 GPU 장점 결합한 뉴프로세서 출시

인텔도 지난 14일 병렬 처리 방식을 도입한 ‘제온파이’ 프로세서를 내놨다. 이 프로세서는 칩 하나에 64~70개 이상의 코어를 탑재해 병렬처리 성능을 높인 제품이다. 이 칩은 보조 프로세서가 아닌 운영체제(OS)를 부팅할 수 있는 프로세서로, 16기가바이트(GB) 전용 메모리가 함께 들어 있다.

제온 파이 프로세서 하나는 3테라플롭스(TFlops·1테라플롭스는 1초에 1조 회의 연산 처리)의 연산력을 갖는다. 인텔 제온 파이 제품군은 128 노드 인프라 상에서 인텔 제온 파이 제품군을 사용하면 단일 노드 대비 최대 50배 빠른 속도로 모델을 훈련 시킬 수 있다.

미세공정 기술 발달로 여러 칩을 하나로 통합하는 흐름도 꾸준히 나타나고 있다. 두 가지 부품을 하나로 합치면 생산 단가와 소비 전력도 낮출 수 있다. GPU를 CPU에 탑재하는 것이 대표적이다. 하나의 칩 안에서 CPU 부분과 GPU 부분이 동일한 버스(bus·데이터를 전달하는 통로)를 사용함으로써 상호 간 데이터 전달 효율을 높일 수 있다. 복잡한 프로그래밍의 과정 없이 CPU의 장점인 정수연산 능력과 GPU의 장점인 부동소수점 연산 능력을 동시에 발휘해 범용적 작업에 적용하기가 용이하다.

인텔은 지난 2011년 출시한 2세대 코어i 시리즈부터 내장 그래픽을 통합해 출시하고 있다. AMD에서는 이러한 새로운 통합 프로세서를 기존의 CPU나 GPU와 구분하기 위해 ‘APU(Accelerated Processing Unit: 가속처리장치)’라는 이름으로 부르고 있다.

삼성전자도 GPGPU 개발을 고려하는 것으로 알려졌다. 삼성전자 자사 모바일 프로세서(AP) ‘엑시노스’를 소개하는 홈페이지를 통해 모바일 GPU에 대한 기술력을 홍보했다.

한 증권사 연구원은 “삼성전자가 이기종 시스템 아키텍처(HSA) 기술을 활용해 AP 내 GPU 등 이종의 프로세서 간 작업 공유를 위한 설계를 개발 중인 것으로 알고 있다”고 말했다.