메인스트림 라인업, 4코어부터 12스레드까지

[테크월드=정환용 기자] 10월 5일 인텔의 8번째 데스크톱 프로세서 ‘커피레이크’(CoffeeLake) 시리즈가 출시됐다. 세대 별로 구분하는 i3, i5, i7 시리즈에서 처음으로 듀얼 코어보다 많은 쿼드 코어부터 시작되는 이번 라인업은, 7세대 커피레이크 시리즈에서 전체적으로 코어가 2개씩 늘었다. 특히 i7 라인업 2종의 코어는 6개, 가상 코어는 12개로 코어 i7 시리즈 최초로 두 자릿수를 넘는 스레드를 갖게 됐다.


8세대 코드네임은 ‘커피레이크’(Coffee Lake)

‘커피레이크’로 명명된 8세대 코어 프로세서 시리즈는 10월 중순 현재 6종이 공개됐다. 지난 8월 모바일 시리즈가 먼저 공개된 이후 i3, i5, i7 등 3개 종류별로 2개씩 공개됐고, 추후 펜티엄 시리즈와 셀러론 시리즈, 제온 시리즈도 순차적으로 출시될 예정이다. 아직 모든 제품이 시중에 판매되고 있는 것은 아니지만, 국내에 출시가 예정된 6개 제품의 상세 스펙은 다음과 같다.

8세대 제품군의 가장 큰 특징은 코어와 스레드 구성의 향상이다. 원래 3개 라인업으로 구성돼 있던 코어 시리즈의 구성은 한결같았다. i3는 듀얼 코어 4스레드, i5는 쿼드 코어 4스레드, i7은 쿼드 코어 8스레드였다. 제품의 크기는 저가형의 셀러론과 고성능의 제온 시리즈가 같지만, 가격 대비 요구 성능이 낮은 수요가 고성능을 지향하는 수요보다 훨씬 많기 때문에 생기는 구분이다.

직전의 7세대 카비레이크까지도 같은 구성을 유지했던 인텔은, 8세대에 이르러 i3에도 쿼드 코어를 적용했다. 8세대의 i3는 전 세대의 i5와 같은 쿼드 코어 4스레드로 구성됐고, 8세대 i5는 코어 숫자가 2개 더 늘어난 헥사 코어 6스레드 구성으로 향상됐다. 그리고 i7은 가상 코어가 2배로 늘어 헥사 코어 12스레드로 구성됐다. 코어 시리즈 첫 두 자릿수 스레드 구성이다.

전작 카비레이크 시리즈와 소켓의 숫자는 같지만, 커피레이크는 7세대와 호환되는 200 시리즈 메인보드에 장착할 수 없다. 8세대 제품을 구입할 예정인 소비자는 새로 출시되는 300 시리즈 메인보드를 사용해야 한다. 소켓 핀 다이어그램의 구조가 조금 다른 것을 보면 개발자 입장에서의 구조 변화를 이해할 순 있으나, 같은 숫자의 핀을 사용하면서 호환성을 염두에 두지 않은 것은 아쉬운 부분이다.

 

14nm 제조공정에 적용된 2세대 3D 트라이게이트 기술.

 

CPU 제조공정이 계속 작아져야 하는 이유
프로세서 자체의 크기는 코어 시리즈 1세대인 린필드부터 커피레이크 까지 거의 차이가 나지 않는다. 하지만 같은 i5 라인을 비교했을 때의 성능은 i5-760과 i5-8400이 2.8GHz로 같은 수준이다. 숫자만 보면 말이다. 세대를 거듭하며 인텔 CPU는 필요에 따라 자동으로 성능을 끌어올리는 터보부스트 기능을 도입했고, i5-8400은 터보부스트로 4.0GHz까지 빨라진다.

i5 린필드 프로세서는 45nm 제조공정으로 만들어졌고, 커피레이크 프로세서는 그보다 약 1/3 작은 14nm 공정으로 생산되고 있다. 같은 크기의 제품 제조공정이 30% 수준까지 작아졌으니, 트랜지스터 집적도 역시 3배 이상 늘었다. i5-760은 약 7억 7400만 개의 트랜지스터가 집적됐고, 3세대 아이비브릿지 14억 개, 그리고 14nm 공정으로 제작된 6세대 스카이레이크는 17억 5000만 개 이상의 높은 집적도가 가능해졌다. 커피레이크가 14nm 제조공정의 마지막 세대인 만큼, 10nm로 더 작아지는 9세대 캐논레이크(Cannon Lake, 가제)에서는 이론상 20억 개 이상의 트랜지스터가 집적되는 것을 상상할 수 있다.

CPU에 더 많은 트랜지스터를 집적해 더 높은 성능을 낼 수 있다는 점을 짚고 넘어가자. 지난해 출시된 14nm 제조공정의 브로드웰 익스트림 프로세서 i7-6950X의 크기는 인텔의 일반 프로세서보다 두 배 가량 크다. 코어도 10개에 20스레드 구성으로, 트랜지스터는 약 32억 개가 집적돼 있다. 개별 코어의 기본 속도는 3.0GHz로 듀얼 코어 2스레드 구성의 7세대 셀러론 G3950과 같지만, 가격 차이는 30배가 난다. 무엇이 30배의 가격 차이를 만들었을까?

지난 2016년 데스크톱 PC 시장 점유율 1위는 20.7%의 레노버, 2위는 19.4%의 HP, 3위는 14.7%의 델이 차지했다. 3개 업체가 데스크톱 PC 시장의 절반 이상을 차지하고 있는데, 이들 기업이 판매하는 데스크톱 PC 주력상품의 사양은 말 그대로 ‘보편적’이다. 전 세계에서 사용되고 있는 데스크톱 PC를 10대로 볼 때, 흔히 ‘게이밍’이나 ‘작업용’으로 통칭하는 고성능 PC의 비중은 2대도 안 된다. 나머지 8대는 ‘중간’을 포함해 저렴한 가격의 저사양 PC가 차지한다.

아래 두 제품의 성능 자체만 봐선 가격 차이를 납득하기 어려울 수 있다. 고성능 게임을 즐기는 사람이라 해도 CPU 구입에만 200만 원 넘는 돈을 들이는 건 쉽지 않다. 최근의 그래픽카드나 RAM 가격 이슈를 제외하고, 약 80만 원대 예산이면 사무업무부터 게임까지 어렵지 않게 즐길 수 있는 성능의 PC를 만들 수 있다. 바꿔 말하면, CPU에만 200만 원 이상을 들여선 소용이 없고, 그에 따른 메인보드와 RAM, VGA 등의 하드웨어를 포함해 적어도 400만 원 이상, 보급형 PC의 5배 이상의 예산이 필요하다는 뜻이다. 여기에 필요한 것은, 사용자가 가격 차이 대비 성능 차이를 감수하고서라도 i7-6950X를 선택하는 ‘근거’다.

G3950과 i7-6950X의 비교. 판매가격은 10월 중순 가격비교사이트의 평균가격이다.

가장 납득하기 쉬운 근거는 ‘시간’이다. 워드프로세서나 웹서핑 등의 일반적인 작업은 6만 원짜리나 100만 원짜리나 큰 차이가 없다. 고사양이 요구되는 작업에서 그 차이가 두드러지는데, 같은 작업을 수행할 때 소요되는 시간은 그 가격의 차이를 감수할 만큼의 차이를 보인다. 어느 분야나 그렇듯, 1에서 10이 되기는 쉽지만 10에서 11이 되기는 어렵다. 작업 시간을 5% 더 줄일 수 있는 가능성에 투자하는 것이 일반 PC와 HEDT PC의 차이라고 보면 된다. 같은 속도의 코어를 4개가 아니라 10개 필요로 할 때가 이와 같은 맥락이다.

 

같은 크기면 많은 코어
프로세서가 하는 주된 업무는 연산이다. 컴퓨터의 성능은 필요한 연산을 얼마나 빠르게 수행할 수 있는지에 달려 있다. 개인용 컴퓨터에 사용하는 CPU는 한 개로, 최대 4개까지 사용할 수 있는 GPU와 달라 프로세서의 성능으로 PC 전체의 성능을 가늠할 수 있다. 가장 보편적으로 사용되는 쿼드 코어 프로세서는 1개의 CPU 내에 같은 성능을 내는 코어가 4개 배치돼 있다. 이 코어가 많으면 많을수록, 속도가 높으면 높을수록 연산속도가 더 빠르고, PC의 성능이 높아진다.

단순 계산으로 이 코어의 숫자를 몇 개가 아니라 몇백만 개, 몇천만 개를 조합한 것이 슈퍼컴퓨터다. 중국의 슈퍼컴퓨터 ‘선웨이 타이후라이트’(神威太湖之光)가 2016년 6월부터 세계 슈퍼컴퓨터 1위 자리를 차지하고 있다. 이 슈퍼컴퓨터의 프로세서는 중국의 지앙난컴퓨터연구소가 자체개발한 프로세서 ‘선웨이26010’(SW26010)을 4만 960개 장착하고 있다. SW26010 프로세서 하나에 260개의 코어가 들어 있어, 총 1000만 개가 넘는 코어가 작동해 초당 10경 회에 가까운 연산을 할 수 있는 것이다.

2016년 슈퍼컴퓨터 순위에서 자국의 기존 1위 ‘텐허2’를 꺾고 1위에 오른 ‘선웨이 타이후라이트.’ 이 슈퍼컴퓨터의 연산속도는 93페타플롭스(Pflops)로, 초당 9경 3000조 회의 연산을 수행할 수 있다. 관계자들은 ‘엑사컴퓨팅’(Exa-Computing, 연산속도 초당 100경 회) 기술에 가까워지고 있는 것은 미국이 아니라 중국이라고 언급하기도 한다. 실제로 과거 세계 슈퍼컴퓨터 500위 내에 든 숫자는 미국이 부동의 1위였으나, 지난 2016년에 중국이 처음으로 미국을 앞서기도 했다.
인텔 4세대 i7-4790과 5세대 i7-6950X의 다이어그램. 22nm 공정으로 제작된 i7-4790은 37.5x37.5mm 크기의 패키지에 그래픽 프로세서를 포함해 4개의 코어가 배치돼 있고, 이보다 2배가량 더 큰 i7-6950X는 그래픽 프로세서가 없고 10개의 코어가 배치돼 있다. 코어 하나의 동작 속도는 3.0GHz로 같지만, 물리 코어와 가상 스레드의 숫자 차이로 프로세서 성능은 i7-6950X가 2배 가까이 더 높다.

 

수십 년 전부터 IT 업계의 발전 기조 중 하나는 ‘소형화’다. 같은 성능이라면 더 작은 크기의 기기가 더 우수하다고 보는 것이다. 인텔과 AMD, 퀄컴, 애플 등 프로세서를 제작하는 기업들이 제조 공정을 낮추는 데 총력을 기울이는 이유 중 하나다. 반도체의 제조공정은 이미 사람의 머리카락(굵기 약 100마이크로미터)을 1만분의 1로 나눌 수 있을 만큼 미세해졌는데, 공정 기술이 물리적인 한계점인 5나노미터에 다다르면 제조 원가가 너무 높아져 생산 비용을 맞출 수 없게 된다.

때문에 삼성전자, IBM, 인텔 등의 기업들은 현재 반도체 제조에 사용되는 CMOS(Complementary Metal Oxide Semiconductor, 상보성 금속 산화막 반도체)와 실리콘을 대체할 수 있는 신물질의 개발과 발견에 몰두하고 있다. 현재 실리콘을 대체할 수 있는 ‘그래핀’(Graphene)이 차세대 반도체 소재로 유력하다.

같은 성능의 데스크톱 시스템과 노트북을 비교했을 때, 노트북의 가격이 더 비싼 것도 같은 이유다. 스마트폰 역시 과거 아이폰 1의 싱글 코어 CPU 속도는 412MHz에 불과했는데, 가장 최근에 출시된 아이폰 8의 쿼드 코어 A11 바이오닉 칩의 속도는 2.74GHz다(모바일 벤치마크 앱 ‘긱벤치’(GeekBench) 참조). 제조공정의 미세화로 이룰 수 있는 첫 번째가 같은 크기의 완성품 내에 더 많은 트랜지스터를 집적할 수 있다는 점이다. 애플이 아이폰 1에 사용한 ARM 1176JZ(F)-S 프로세서의 제조공정은 180nm 정도였고, 최신 A11 바이오닉 칩은 10nm로 20배율 가까이 미세해졌다. 같은 크기의 프로세서에 약 180배 더 많은 트랜지스터를 집적하게 된 것이다.

그러나 성능의 가치를 단순히 숫자로만 판단하는 건 무리다. 1960년대에 우주비행선을 쏘아올리던 NASA의 컴퓨터의 성능은, 현재의 스마트폰보다 높지 않았다. 1990년대에 3D 게임이 처음 나왔을 때는 3차원 그래픽이란 것 자체로도 모든 사람들을 놀라게 했지만, 지금은 어지간한 고품질 그래픽이 아니면 관심을 끌기조차 쉽지 않다. 스마트폰과 태블릿PC의 프로세서 성능을 숫자로만 보면 데스크톱과 견줄 정도지만, 실제로 절대적인 성능 지수의 차이는 데스크톱 프로세서가 압도적이다. 이는 프로세서 자체 성능 뿐 아니라 전용 운영체제를 비롯해 시스템 운용의 용도와 목적이 상이하기 때문이다.

 

TIM(Thermal Interface Material), 여전히 문제
CF카드 크기의 프로세서가 GHz 단위의 주파수를 표시하며 초당 200억 회가 넘는 연산을 수행하면, 트랜지스터가 신호를 전달하며 전기 소모와 동시에 열을 발생시킨다. 이 열에너지를 제대로 외부로 분산시켜야 반도체에 무리가 가지 않고, 프로세서가 꾸준히 제 성능을 발휘할 수 있다. 때문에 어떤 프로세서든 공기, 냉매 등을 이용한 냉각 시스템이 필수다. 그리고 이 부분이 인텔의 CPU가 계속해서 소비자들의 반감을 사고 있는 부분이다.

코어와 히트 스프레더 사이의 공간은 열을 전달할 수 있는 물질로 메워야 한다. 여기에 필요한 것이 열전도 물질 ‘TIM’이다. 프로세서 제조사들은 보통 2가지 방법을 쓰는데, 서멀 컴파운드를 도포하는 것이 첫 번째, 그리고 희귀금속인 인듐(Indium) 합금으로 접합하는 솔더링(Soldering)이 두 번째다.

두 방법은 특징이나 장단점이 거울을 보고 마주선 것처럼 반대 성향을 띤다. 서멀 컴파운드는 솔더링보다 열전도율이 낮아 높은 온도에 대한 대처가 늦고, 솔더링은 코어와 히트 스프레더를 납땜처럼 직접 접합하기 때문에 열전달이 효과적이다. 하지만 솔더링에 사용하는 인듐은 연 채광량이 금보다 적을 만큼 귀한 금속인데다가, 실리콘으로 만든 칩과 니켈 도금된 구리 재질의 히트 스프레더를 접합할 수 있는 거의 유일한 금속이어서 대채제가 없다. 덕분에 이를 적용하게 되면 제품의 생산단가가 서멀 컴파운드를 사용할 때보다 상승한다.

절대적인 성능 차이를 보면 서멀 컴파운드보다 솔더링이 좀 더 유리한 것은 사실이다. 하지만 솔더링에도 단점이 있다. 모든 금속은 팽창과 수축을 하는데, 약 450도 이하의 온도에서 접합을 마친 인듐은 온도가 내려가면서 점점 수축하게 된다. 게다가 실리콘과 구리의 열팽창계수는 약 6배 차이로, 같은 온도에서 구리가 실리콘보다 5배 이상 팽창한다. 결국 솔더링을 마친 프로세서의 온도가 실온으로 안정되면서 1/5 이상 수축해, 접합부에 균열이 발생할 수 있다. 다만 접합부에 균열이 생기는 기준은 일반적인 CPU사용 환경과는 약간 동떨어져 있어, 해당 문제를 솔더링하지 않는 근거로 삼기에는 설득력이 부족하다.

프로세싱 유닛과 히트 스프레더 사이에는 공간이 있다. 흔히 ‘뚜껑’이라 부르는 CPU 상단의 히트 스프레더는, 이름처럼 코어 보호보다는 코어에서 발생한 열을 분산시켜 주는 역할이 더 크다.

인텔이 TIM 문제에서 손가락질을 받는 것은 약간은 상대적인 부분이다. 라이젠 시리즈로 시장 점유율을 과거의 경쟁기업 수준으로 되찾고 있는 AMD는, 모든 라이젠 시리즈 CPU에 솔더링을 적용했다. 반면 인텔은 다이 사이즈가 115x보다 큰 2011 소켓의 프로세서를 제외하고는 모두 서멀 컴파운드를 사용하고 있다. 게다가 비슷한 라인업의 경쟁제품 대비 가격이 낮은 것도 아니다. CPU의 온도 관리에 대한 이슈 또한 근 2년여 동안의 신제품 출시 당시부터 꾸준히 이어지고 있는 것도 악재 중 하나다.

인텔과 AMD, 두 기업의 신제품에 대한 평가는 항상 성능과 가격으로 양분되는 것이 보통이었다. 그러나 지금은 사용자나 판매자, 개발자 측면에서 점점 독점 수준이었던 점유율이 경쟁 수준으로 맞춰지고 있다. 2017년 2분기 CPU 점유율에서 AMD는 드디어 30%를 돌파했고, 인텔의 점유율은 10여 년만에 70% 이하로 떨어졌다. 단지 생산성의 향상과 원가 절감을 위한 선택이라고 하기에는, 지금까지의 손실로 보면 이해할 수 없는 선택이었다. 2018년 상반기 출시 예정인 AMD의 ‘피나클 릿지’(Pinnacle Ridge) 시리즈가 등장했을 때, 인텔의 점유율이 ‘상승’보다 ‘하락’을 더 쉽게 떠올리는 이유다.

회원가입 후 이용바랍니다.
개의 댓글
0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400
내 댓글 모음
저작권자 © 테크월드뉴스 무단전재 및 재배포 금지