소문만 무성하던 인텔의 차세대 프로세서, 코드명 하스웰(Haswell)이 4세대 코어 프로세서라는 옷을 입고 모습을 드러냈다. 2013년 초에 등장할 것이라는 당초 예상을 뒤집고 2013년을 절반 가량 보낸 6월에서야 나타난 것이다.
미세공정과 새 아키텍처 도입을 번갈아 가며 진행하는 인텔의 틱-톡 전략에 따라 '톡'이 되는 4세대 코어 프로세서는 이전 세대의 공정을 유지하지만, 새로운 마이크로 아키텍처가 도입되면서 뛰어난 성능을 보일 것이라는 기대가 크다.
이는 3세대 코어 프로세서인 코드명 아이비브릿지(IvyBridge)의 22나노미터 공정은 유지하면서 새로운 아키텍처를 도입했다는 얘기다. 차기에 선보일 브로드웰(Broadwell)은 14나노미터 미세공정이 도입될 예정이다.
▲ 인텔의 틱-톡
로드맵. 계획에 따라 한 번은 새 아키텍처의 도입,
한 번은 미세공정의 도입을 통해서
꾸준히 발전해 나가고 있다
데스트톱 PC에 쓰일 4세대 코어 프로세서는 기본형 라인업부터 오버클럭을 위한 배수 해제가 이뤄진 K 시리즈, 저전력 기반의 S, T 시리즈 등으로 나뉘어 출시될 전망이다. 저전력 프로세서들은 적게는 35W부터 많게는 65W의 열설계전력(TDP) 구조를 갖는다. 작동속도의 차이가 있지만, 고성능 저전력을 추구하는 시장에서 빛을 발할 것으로 기대된다.
▲ 데스크톱 PC 라인업은
고성능을 추구하는 K, 저전력 시장을 위한
S, T 시리즈 등을 포함해 총 4개 라인업으로
구축된다
사실, 새로운 아키텍처 도입이라는 측면에서 보면 프로세서의 근본적인 틀 자체가 변화한 것은 아니다. 기존 아키텍처의 좋은 것은 대부분 유지하면서 효율을 높이기 위해 손질을 가했고, 일부 새로운 명령어를 추가하면서 성능 향상을 꾀했다고 보는 게 옳다. 같은 속도에서 일을 하더라도 이전 세대 프로세서보다 더 많은 일을 효율적으로 빠르게 처리하는 것에 중점을 둔 것으로 풀이할 수 있다. 이는 프로세서의 코어 다이를 봐도 한 눈에 알 수 있다.
3세대 코어 프로세서와 4세대 코어 프로세서를 비교하면, 육안으로 큰 차이가 발견되지는 않는다. 4개의 코어와 그래픽 프로세서, 인텔 스마트 캐시, 데이터 입출력과 메모리 관리, 외부 장비 등을 관할하는 시스템 에이전트 컨트롤러가 동일한 자리에 내장돼 있다.
다이 사이즈는 177 제곱 밀리미터로 160 제곱 밀리미터였던 3세대보다 조금 커졌지만, 트랜지스터 수는 14억 개로 동일하다. 다이 사이즈가 커진 것은 그래픽 프로세서가 차지하는 공간이 조금 늘었기 때문으로 풀이된다.
▲ 3세대 코어 프로세서와
4세대 코어 프로세서의 다이 구조 비교.
육안으로 보이는 구성 자체는 차이가 없지만
그래픽 프로세서가 차지하는
공간에 약간 차이가 있으며 다이 크기가 조금 증가한
정도다
톡하고 나타난 4세대 코어 프로세서. 과연 어떤 새로운 것이 담겨있고, 어떤 결과로 이어지게 될지 궁금하다. 이에 하스웰 아키텍처가 말하는 여러 기술 중 중요한 것 일부에 대해 알아보자.
■ 고급 벡터 확장(Intel
Advanced Vector Extensions - AVX) 2.0
▲ 기존 코어 프로세서에
추가됐던 AVX의 기능을 강화시켜
AVX 2.0이라는 이름으로 4세대 코어 프로세서에
투입된다
2세대 코어 프로세서에 추가되면서 성능 향상을 이끌어낸 고급 벡터 확장 기술이 4세대 코어 프로세서로 진화하며 더욱 강화됐다. AVX는 단일 명령어 다중 데이터의 레지스터 폭이 128비트에서 256비트로 확장되면서 부동소수점 연산 처리 성능이 최대 두 배 향상됐다. 게다가 연산구조도 기존 2항 구조에서 3항 구조로 바뀌면서 프로그래밍 효율도 높아졌다.
AVX 2.0은 이런 장점을 더 부각하고 성능을 개선하는데 노력한 흔적이 보인다. 256비트 정수 명령어와 부동 소수점 곱셈 추가(Floating-point fused Multiply Add - FMA) 명령어를 더한 것이다. 별 것 아닌 것 같아 보이지만, 실제 우리가 쓰고 있거나 쓸 예정인 애플리케이션에서 성능 향상을 가져올 것으로 기대된다.
특히, FMA를 활용해 얼굴을 인식하거나 3D 모델링 같은 고급 이미징 처리 작업, 고성능 컴퓨팅에도 적극 쓰인다는 얘기다. 인텔의 자료에 따르면, 4세대 코어 프로세서는 압축과 암호화 등에서도 AVX 2.0을 활용할 것이라고 한다.
■ 고급 암호화 표준 새 명령들(Intel Advanced Encryption Standard New Instructions - AES-NI)
▲ 인텔의 AES-NI에
대한 설명. 소프트웨어 기반이 아닌 하드웨어 기반으로
강력하면서도 빠른 암호화·복호화를
이루겠다는 의도가 담겨 있다
암호 복호화에 쓰는 기술로, 이미 이전 세대 아키텍처(웨스트미어)에서도 쓰였다. 그러나 프리미엄 라인업에 한정되어 있었으며, 보급형 프로세서는 이를 지원하지 않았다. 3세대 코어 프로세서(샌디브릿지) 이후부터 대부분의 제품에서 AES-NI를 지원하게 되었고, 4세대 코어 프로세서는 최신 명령어를 추가해 성능을 높였다.
AES는 보안에 쓰이는 알고리즘 중 하나로, 중요 파일 또는 네트워크에 암호를 걸어 보호할 때 활용된다. 와이파이나 인터넷 공유기 등을 이용해 기기나 파일을 공유할 때 비밀번호를 설정하면 AES는 이를 128비트나 256비트로 암호화해 외부 접근을 차단하는 것이다.
최근에는 압축 파일 알고리즘에도 AES 적용 사례가 늘고 있다. 7-Zip이 대표적인 애플리케이션으로, 이 외에 여러 압축 애플리케이션이 AES 지원을 늘려가는 추세다. 기존 프로세서도 마찬가지였겠지만, 4세대 코어 프로세서도 이런 암호·압축 환경에서 좋은 효율을 보여줄 전망이다.
4세대 코어 프로세서에서 지원하는 AES-NI는 기본적으로 AESENC, AESENCLAST, AESDEC, AESDELAST 외에 AESIMC, AESKEYGENASSIST 등 두 확장 프로시저가 있으며, 프로세서 자체에서 가속해 암호화 및 복호화에 대해 높은 성능과 유연성을 갖게 됐다. 뿐만 아니라, PCLMULQDQ 명령어도 지원하면서 적용 범위를 넓혔다.
PCLMULQDQ는 128비트 단일 명령어 다중 데이터(SIMD)로 암호화 시스템 및 표준의 필수적인 처리 구성 요소로 자리잡고 있다. 이를 프로세서 차원에서 지원하면서, 컴퓨팅과 통신 환경을 안전하고 빠르게 유지 가능하다.
■ 고급 동기화 처리 확장(Intel Transactional Synchronization Extensions - TSX)
▲ 다소 복잡해 보일
수 있겠지만, 말 그대로 TSX는 멀티 코어를 활용하는
소프트웨어를 적극 지원하기
위한 명령어 구성이다. 이것이 적용됨으로써 앞으로
멀티코어를 활용하는 소프트웨어의
성능 향상이 기대된다.
PC는 성능을 높이기 위해 다중 코어 기술을 적극 활용해 왔고, 지금도 그 활용 범위를 계속 넓혀가고 있다. 듀얼코어는 기본, 쿼드부터 헥사, 옥타 등 한 개의 CPU에 여러 코어를 담아 성능을 높였고, 이들은 한 코어당 한 개의 명령(Thread)을 처리한다. 다중 코어 기술의 핵심은 한 개의 코어가 처리하던 명령을 여러 코어가 분산해 처리하면 효율이 증가하는 부분이다.
문제는 소프트웨어. 다중 코어를 활용하기 위해서는 여러 명령간 공유 데이터를 효과적으로 프로그래밍해야 한다. 그런데, 병렬 프로그래밍은 각 명령간 작업 동기화 문제와 버그 등 여러 문제로 인해 제작의 어려움이 따른다.
TSX는 크게 특정 상황에서 하드웨어적으로 락을 생략할 수 있게 처리하는 ①하드웨어 락 생략(Hardware Lock Elision), 제한적이지만 트랜잭션의 시작과 중단, 끝을 지시하는 등의 명령어를 지원하는 ②Restricted Transactional Memory, 프로세서가 처리 지역에 대해 실행할지를 돌려보내는 ③XTEST 명령 등 세 가지 특징을 갖는다.
인텔은 병렬 프로그래밍의 가장 큰 문제였던 동기화 문제를 해결하기 위해 고급 동기화 처리 확장(TSX) 명령어를 4세대 코어 프로세서에 추가해 병렬 프로그래밍에 대한 문제를 하드웨어적으로 처리하게 된다. 물론 프로세서가 자동으로 처리하지 못하고 프로그래머가 어느정도 작업을 해야 하지만 인텔이 새로운 기술을 적극 도입했다는 점에서 주목할 필요가 있겠다.
■ 인텔 HD 그래픽스 4600 탑재
▲ 인텔 HD 그래픽스
4600은 지원하는 출력 단자의 범위도 적극적이고
해상도 역시 크게 늘었다. 3세대
코어 프로세서와는 큰 폭으로 달라졌다
4세대 코어 프로세서가 품고 있는 내장 그래픽의 성능도 향상됐다. 기본 성능 향상은 물론, 지원하는 기능도 추가됐다. 지원 해상도도 강화되었고 단자 구성도 눈에 띄게 늘었다. 디스플레이 포트를 적극 활용한다는 점이 돋보인다.
해상도는 1칩 솔루션의 경우 디스플레이 포트(Display Port)와 HDMI 단자를 활용해 개당 3,200 x 2,000 해상도를 지원하게 된다. 최대 세 개의 모니터를 물리는 3 동시 디스플레이(3 Simultaneous Display) 기술도 쓸 수 있다. 2칩 솔루션은 디스플레이 포트, HDMI, VGA 단자 등을 총 동원해 최대 4,096 x 2,304인 4K 해상도도 쓸 수 있다. 기존 3세대 코어 프로세서는 2,560 x 1,600 해상도까지 지원했었다.
이 외에도 노트북도 마찬가지지만 데스크톱에서도 인텔 무선 디스플레이, 와이다이(WiDi) 기술을 쓸 수 있다.
■ 업그레이드 된 전력관리
▲ 4세대 코어 프로세서는 쓸데없이 새는 전력을 막기 위한 다양한 시도가 녹아 있다
성능을 내는 것도 좋지만, 이를 효율적으로 운용하는 것도 매우 중요하다. 최근에는 전력 활용에 대한 시장의 관심이 증가하면서 인텔도 TDP에 신경 쓰지 않을 수 없게 됐다. 비록 4세대 코어 프로세서의 TDP는 늘었지만, 이를 효율적으로 활용하는 기술이 추가되면서 효율을 높였다. 얼마 전, 화제가 되었던 C7 스테이트에 대한 것이 대표적인 예다.
어떻게 전력 효율에 대한 기능이 강화됐을까? 먼저 액티브 모드(S0)에서 S3, S4 절전 모드에서의 복귀 지연 시간을 대폭 줄인 S0ix가 새로 생겼다. 프로세서가 쓰는 전압과 TDP 제어를 이전 세대 코어 프로세서보다 더 다단화하고, 이를 빠르게 전환하면서 상황에 따른 전력 수요에 대응하는 방식을 택했다. CPU 코어 이외의 요소를 모두 차단할 수 있도록 설계해 쓸모 없는 전력을 쓰지 않도록 하고 있다.
C7은 C6 스테이트보다 한 단계 더 낮은 범위. 디스플레이는 인가된 상태지만, CPU 코어 자체는 전력을 쓰지 않아 사실상 전력 차단 상태로 전환된다.
■ 손 안에 들어 온 4세대 코어 프로세서… 어떻게 구성되나?
4세대 코어 프로세서는 먼저 코어 i7 프로세서 6종, 코어 i5 프로세서 4종이 출시되고, 추후 코어 i5 프로세서 라인업 3종이 합류할 예정이다. 시간이 지나면 코어 i3 라인업도 추가될 예정이다.
코어 i5 프로세서는 이전 세대와 마찬가지로 4개의 코어로 구성되는 쿼드코어 제품이며, 하이퍼스레딩은 지원하지 않는다. 제품에 따라 열설계전력(TDP)은 45W에서 84W까지 구성되지만, 소비자가 시장에서 손에 넣을 수 있는 것은 84W의 TDP를 갖는 코어 i5-4570, 4670, 4670K가 될 것으로 예상된다.
코어 i5-4570은 4세대 코어 프로세서 보급의 첨병이 되는 제품으로, 3.2GHz의 작동속도(터보부스트 시 3.6GHz)와 6MB 인텔 스마트캐시, 84W 열 설계 전력 사양을 갖췄다. DDR3 메모리 작동속도는 1,333MHz~1,600MHz까지 지원한다. 내장 그래픽으로 인텔 HD 그래픽스 4600이 탑재됐다.
한편, 코어 i5-4670은 기본 작동속도 3.4GHz(터보부스트 시 3.8GHz) 외에는 i5-4570과 동일하다.
▲ 4세대 코어 i5 프로세서 라인업. 저전력부터 고성능 라인업까지 다양하게 포진됐다
▲
4세대 코어 i7 프로세서
라인업. 코어 i5와 마찬가지의 구성이지만
인텔 아이리스 프로 그래픽이 탑재된 R
라인업이 있는 것이 눈에 띈다
코어 i7 프로세서 라인업은 다소 촘촘하지만, 시장에서 구할 수 있는 것은 i7-4770, 4770K 정도가 될 것으로 예상된다.
리뷰=강형석 테크니컬라이터
기획/진행 오국환 기자 sadcafe@it.co.kr