Conroe 등장!
필자는 얼마 전
Intel Extreme Edition 955 기사를 다루면서 Conroe에서 AMD CPU와의 진정한 승부를
가를 수 있을 것이라고 언급한 적이 있었다. 해외의 리뷰 등을 통해 코드명 Conroe 즉, 인텔에서 정해진 이름으로 부르자면
Core2 시리즈 CPU들의 성능이 공개되고 있어 하드웨어에 관심 있는 많은 사용자들에게 높은 관심과 기대를 한 몸에 받고
있다. 발열, 소비전력, 성능 등에서 모두 기존 CPU들을 넘어서고 있다.
이 시점에서 오래된 얘기지만, NorthWood 코어 CPU들이 나왔을 때가 생각나는데 윌라멧
시리즈의 문제를 해결하여 인텔 CPU 전성시대를 열었던 장본인이기도 하다. 그 이후로 프레스캇이 나오고 이를 개선한
Presler CPU들도 나왔지만 경쟁사 CPU에 고전하였던 것을 생각하면 이번 Conroe의 등장은 인텔의 절치부심한
노력이 엿보이는 CPU라고 할 수 있다.
그렇다면, 인텔
코어 마이크로 아키텍처로 대표되고 있는 코드명 Conroe, 즉 Core2 시리즈 CPU들은 어떠한 특징들을 가지고 있는지 살펴보도록 하자.
Intel Core Micro-Architecture 어떤 특징을 가지고 있는가?
이번에 발표된 인텔 코어 마이크로 아키텍쳐의 핵심은 저전력과 발열의 감소, IPC 향상으로 볼
수 있으며, 궁극적으로 성능 향상을 위해 만들어진 것이라 할 수 있다. 기존 모바일 프로세서들의 장점과 더불어 데스크탑
CPU에 적용되었던 넷버스트 아키텍쳐의 장점을 혼합한 것이다. 인텔 코어 마이크로 아키텍쳐를 적용함으로써 기존 CPU와
비교하여 클럭대비 성능을 높이고 소비전력과 발열은 줄이면서 IPC의 성능을 향상 시킬 수 있게 되었다.
5가지의 변화
기본적으로 아래의 5가지 핵심적인 요소의 변화를 통해 넷버스트의 문제인 발열과 소비 전력, 성능
부분을 개선하게 된다.
1. Intel Wide Dynamic Execution
넷버스트 아키텍쳐를 적용한 기존 CPU들은 클럭당 처리할 수 있는 인스트력선의
수 즉, IPC보다는클럭 향상에 중점을 두었는데 모바일 아키텍쳐의 장점을 수용하게 됨에 따라 클럭 상승보다는 IPC의
향상에 중점을 두게 된다. 따라서, 넷버스트 아키텍쳐가 31 단계의 파이프라인 스테이지를 가졌던 반면, 코어 마이크로
아텍쳐에서는 절반 이하인 14단계로 줄여 IPC를 향상하기에 이른다.
그러나, 파이프라인을 14개로 줄여 클럭은 향상시킬 수 있지만, 클럭 항상에
따라 IPC는 그만큼 떨어질 수 있으므로 여기에 새로운 성능 향상 방법을 추가해야 했다. 그것이 바로 인스트럭션 디코더의
성능을 개선하는 것이다. 인텔에서는 이 성능을 개선하기 위해 더 많은 디코더를 추가하는 방법으로 성능 향상을 꾀했다.
모바일 아키텍쳐가 사용하는 3개보다 많은 4개의 사용으로 기존 x86 프로세서보다 33% 이상의 인스트력션 디코딩 성능
개선이 가능하게 되었다.
여기에 추가로 마이크로 퓨전(Macro-Fusion) 이라 불리는 기술을
추가하였다. 이 기술은 이미 모바일 프로세서들에 적용되고 있는 기술로 하나의 디코더로 두 개의 인스트럭션 즉, 두 개의
명령어를 하나로 묶어 처리할 수 있도록 해주는 것이다. 이를 적용하지 않는 경우 5개의 명령어가 들어와 있다고 가정하면,
4개를 처리한 후 나머지 하나를 다음에 처리하게 되어 두 번의 과정을 거치지만, Macro-Fusion을 적용하면 명령어를
5개 중 2개를 한번에 처리하고 나머지 3개의 처리를 진행하여 한 번의 과정으로 끝낼 수 있게 된다. 그만큼 처리되는
과정을 줄여 성능 향상을 가져올 수 있게 된 것이다.
2. Intel Advanced Digital Media Boost
인스트럭션 디코딩 성능 개선과 함께 SSE(Streaming SIMD
Extensions) 처리 성능도 개선을 위해 128-bit SSE 명령을 한 사이클에 처리하도록 개선하였다. 기존 연산
방식은 64-bit 단위로 나누어 디코딩 한 후 모아서 128-bit 하나로 처리하여 두 번의 클럭 사이클을 사용하기
때문에 효율적이지 못하였다. 그러나, 코어 마이크로 아키텍쳐에서는 한 클럭 사이클에 128-bit SSE 명령어를 처리할
수 있게 개선 되었으며, 이로 인해 SSE 연산 부분이 향상되었고 멀티미디어 관련 성능도 기존보다 높은 성능을 기대할 수
있게 되었다.
3. Intel Advanced Smart Cache
기존 넷버스트 아키텍쳐를 가진 펜티엄D 제품들의 경우 CPU 하나마다 일정량의
할당된 캐쉬를 가지고 있다. 그렇기 때문에 만약 Core1과 Core2가 필요한 자료가 Core2 캐쉬에 저장되어 있다면,
시스템 메모리를 거쳐 다시 Core1의 캐쉬에 불러와야 한다. 이런 복잡한 과정을 거치기 때문에 지연의 문제 등이 발생하고
FSB 대역폭에 그만큼 불리함을 갖게 된다. 그러나, 코어 마이크로 아키텍쳐에 적용된 Advanced Smart Cache
기술을 사용하면 제공되는 캐쉬를 동적으로 끌어다 사용하여 캐쉬 적중률을 높이고 FSB 대여폭의 병목 현상도 줄임과 동시에
데이터의 지연시간을 줄여 그만큼 효율적인 작업이 가능하게 된다. 이 기술 역시
배니아스 마이크로아키텍쳐 기반의 코어인 Yonah 코어의 Core Duo 프로세서에 사용되고 있는 기술이다.
4. Intel Smart Memory Access
연산에 필요한 데이터를 찾기 위해서는 L1 캐쉬를 찾고 여기에 없다면 L2
캐쉬를 찾게 되며, L2 캐쉬에도 없을 경우에는 외부 시스템 메모리로부터 데이터를 찾아오게 된다. 이런 복잡한 과정을
거치게 되면 그만큼 성능이 떨어지게 되는 것을 부인할 수 없다. 이런 복잡한 과정을 줄이기 위해 사용한 기술이
Smart Memory Access이다. 어떤 작업을 진행할 때
순차적으로 진행하다 원하는 자료가 없을 경우 다른 곳을 참조하게 되면 두 번의 일을 진행하게 되는 것인데 이 처리 과정을
줄이기 위해 원하는 작업을 불러올 동안 다른 작업을 진행한 후 원하는 작업을 진행하면 되는 것이다. 이 기술이 바로
명령어를 재배치하여 데이터 전송 지연을 최소화하는 Smart
Memory Access이다.
5. Intel Intelligent Power Capability
마지막으로 전력 관리 기술에서도 코어 마이크로 아키텍쳐에서 변화를 주었다.
코어 마이크로 아키텍쳐에는 노트북 프로세서에도 맞게 설계되었고 와트당 성능에 최적화되도록 설계되었다. 코어 마이크로
아키텍쳐가 적용된 CPU는 사용하지 않는 부분은 작동하지 않게 하고 사용해야 할 때는 다시 작동이 가능한 상태로 만들어
소비 전력을 줄이도록 하고 있다. 이 때 발생할 수 있는 응답시간의 문제도 해결하고 있다. 물론, 공정의 개선과 다양한
기술이 적용된 트랜지스터들의 사용으로 가능해진 것이고 Enhanced Intel SpeedStep과 Enhanced
Halt Sate도 적용된다.
지금까지 살펴본 5가지의 중요 변화를 통해 기존 넷버스트 아키텍쳐의 문제점과 모바일 아키텍쳐의
장점을 혼합하여 성능 향상을 꾀한 것이 바로 코어 마이크로 아키텍쳐라고 할 수 있다. 보다
자세한 내용을 알고 싶다면,
이번엔 확 바꼈다!, INTEL Core 마이크로아키텍처를 참고하길 바란다.
그러면, 지금부터 최상위 CPU들인
Intel Core2 Duo E6700, Core2 Extreme X6800,
Extreme Edition 955의 3가지 인텔 CPU를 통해 과연 Conroe 즉, Core2 시리즈 CPU들의 특징은
무엇이고 성능은 어떤지 확인해보도록 하자.
|