G92 코어를 기반으로 한 NVIDIA GeForce 8800GTS 512MB는
그래픽시장의 세대교체를 가져올 폭풍의 눈! NVIDIA GeForce 8800GT 장착 Leadtek Winfast
8800GT Extreme 기사에서 살펴본 G92 코어 기반
NVIDIA GeForce 8800GT 512MB와 동일한 G92 코어를 가지고 있으며, 코어와 메모리, 쉐이더 클럭의
차이, 그리고 스트림 프로세서에서 차이를 보이고 있으며, 어떠한 차이를 가지고 있는지 살펴보자.
128개의 스트림 프로세서를 제공하는 G92 코어 8800GTS 512MB
[G92, GeForce 8800GT 512MB 스트림 프로세서 유닛 구성 (112SP)]
[G80, GeForce 8800 시리즈 스트림 프로세서 유닛 구성 (128SP)]
G92 코어를 적용한 새로운 GeForce 8800GTS 512MB는 G92 코어를 적용한 GeForce 8800GT보다 한
그룹의 스트림 프로세서 유닛을 추가하여 112개에서 16개 늘어난 128개의 스트림 프로세서를 갖는다. 이는 NVIDIA GeForce
8800GTX 768MB와 GeForce 8800 Ultra 768MB가 가진 스트림 프로세서 유닛과 동일한 갯수다.
하지만, 상위 G80 코어 기반의 8800GTX나 8800 Ultra와 동일한 128개의 스트림프로세서를 제공하는 대신
메모리 인터페이스는 상위 제품들이 384bit를 제공하는 것과는 달리 256bit로 줄어들었고 대신 코어와 메모리, 그리고
쉐이더 클럭을 크게 높여 줄어든 메모리 인터페이스를 보완해주고 있는 방식이다.
또, ROP (Raster Operation, Render Back-End Units) 역시 G80 8800GTX와
8800 Ultra가 6개로 이루어진 그룹마다 4개의 픽섹을 한 클럭에 처리할 수 있어 총 24개의 픽셀 처리 능력을
가지는데 G92 8800GT 512MB와 8800GTS 512MB는 16개로 줄어들었다.
그 외 DirectX 10, Shader Model 4.0, 통합 쉐이딩 아키텍처는 그대로 유지되며, FP16과 FP32
지원이 추가되어 HDR + AA의 지원, 128bit HDR 렌더링 지원에는 차이가 없다. 추가로
Anti-Aliasing에서 기존보다 향상된 4xMSAA와 16x CSAA 지원 부분 역시 차이는 없지만, 새로운 Trancsparency
Multisampling (TRMS) 알고리즘을 적용하여 이미지 품질 개선과 함께 성능 저하를 줄였다고 NVIDIA는
밝히고 있어 AA 성능 저하 부분을 개선한 것으로 나타났다.
DirectX 10과 통합 쉐이딩 아키텍처
등에 대한 궁금한 내용은
나를 타짜라 불러다오!! XFX GeForce 8800 GTX 기사와
G80 GPU의 내부 구조는
코드명 G80, DirectX 10, nVIDIA GeForce 8800
/ 도대체 어떤게 바뀐거야?와
그래픽시장의 세대교체를 가져올 폭풍의 눈! NVIDIA GeForce 8800GT 장착 Leadtek Winfast
8800GT Extreme
기사를 통해 소개되고 있으므로 참조하면 된다.
쉐이더 처리 능력 향상을 위한 스트리밍
프로세서 구조 개선
[8800
시리즈에 적용된 스트리밍 프로세서 구조]
GeForce 8800 시리즈는 16개의
스트리밍 프로세서가 총 8 그룹이 사용되어 최대 128개의 스트리밍 프로세서가 제공된다. 16개 스트리밍 프로세서 하나의
구조는 텍스처 처리를 위한 텍스처 필터링과 텍스처 어드레스 유닛, 그리고 Shader 연산 작업을 빠르게 처리하기 위한
L1/ L2 캐쉬가 제공된다.
이미 GeForce 8500과 8600
시리즈를 소개하였을 때 언급하였던 부분으로 G80 코어 기반의 8800 시리즈와는 다르게 G92 코어 8800GT
512MB와 8800GTS 512MB는 모두 텍스처 어드레스 유닛과 텍스처 필터링 유닛이 1:1 구성을 하고 있다. G80
코어 8800 시리즈 (8800GTX, 8800 Ultra 등)의 경우 이와는 다르게 1:2의 구성을 하고 있다.
결과적으로 텍스처 어드레스 유닛과 텍스처
필터링 유닛을 1:1로 구성함에 따라 텍스처 처리 능력 향상을 통해 클럭 당 쉐이더 처리 능력이 높아졌다. G92코어 8800GT
512MB는 56 텍스처링 프로세서
(텍스처 어드레스 유닛 8개, 텍스처 필터링 유닛 8개로 1:1 (56 : 56) 구성을 하고 있다.) G92 8800GTS
512MB는 64 텍스처링 프로세서
(텍스처 어드레스 유닛 8개, 텍스처 필터링 유닛 8개로 1:1 (64 : 64) 구성을 하고 있다.)
2세대 PureVideo HD 지원 및 H.264 가속을 위한
BSP 엔진 제공
[G92 기반 8800GTS는 BSP를 통해 H.264 가속시 CPU 점유율을 낮춰준다.]
G92 기반의 GeForce 8800GT
512MB와 GeForce 8800GTS 512MB는 모두 이전 세대의 G80 코어가 1세대 PureVideo HD를
지원하여 H.264 하드웨어 가속 부분에서 CPU 점유율이 높았지만, GeForce 8500과 8600 시리즈부터는 2세대
PureVideo HD를 지원하고 H.264 코덱 가속을 위한 BSP 엔진을 내장했는데 G92 8800GT와
8800GTS는 모두 2세대 PureVideo HD 및 Video Processor 2, BSP 엔진 내장을 통해 CPU
점유율을 낮출 수 있게 된다.
하지만, 경쟁사의 HD 3800 시리즈들은 UVD (Unified Video Decoder)를 통해 H.264를 비롯하여 VC-1까지 하드웨어 가속 기능을 제공하므로
VC-1 코덱의 경우 G92 기반 8800GT와 8800GTS보다 CPU 점유율 면에서 유리하다. VC-1 코덱의 경우
G92 기반 8800GT와 8800GTS는 HD 3800 시리즈보다 아직까지
CPU 점유율이 높은 편이다. 새롭게 등장할 G98 코어 기반의 GeForce 8400GS 제품의 경우 VC-1 가속까지
제공하는 것으로 알려지고 있는 상태다.
2세대 PureVideo HD를 지원하는
G92 기반 8800GT와 8800GTS 512MB는 1세대 PureVideo HD를 지원하여 BSP 엔진 등이 제외되고
있는 GeForce 7 및 8800 시리즈보다 낮은 CPU 점유율을 보여준다. 2세대 PureVideo HD에서는 CPU의
부하를 많이 차지하는 과정을 BSP 엔진을 통해 처리해주어 CPU의 점유율을 낮춰준다. CPU가 처리해주던 CABAC
(가변 길이 부호화)와 CAVLC (산술 부호화) 과정을 모두 GPU의 BSP 엔진이 이를 처리해주기 때문에 CPU의
점유율을 낮출 수 있다.
G92 코어 8800GT와 G80코어
8800 시리즈 등의 H.264와 VC-1 가속 성능은
그래픽시장의 세대교체를 가져올 폭풍의 눈! NVIDIA GeForce 8800GT 장착 Leadtek Winfast
8800GT Extreme
기사를 참조하자.
G92 코어 8800GT/ 8800GTS와 G80 코어 8800 시리즈 비교
스펙 |
GF 8800GTS |
GF
8800GT |
GF 8800GTS |
GF 8800GTX |
GF 8800Ultra |
제조공정 |
65 nm (G92) |
65nm (G92) |
90 nm (G80) |
트랜지스터 |
7억5천4백만 |
7억5천4백만 |
6억8천1백만 |
코어클럭 |
650 MHz |
600 MHz |
500 MHz |
575 MHz |
612 MHz |
Shader 클럭 |
1625 MHz |
1500 MHz |
1200 MHz |
1350 MHz |
1500 MHz |
스트림
프로세서 |
128 개 |
112 개 |
96 개 |
128 개 |
메모리 클럭 |
1940 MHz |
1800 MHz |
1600 MHz |
1800 MHz |
2160 MHz |
메모리
인터페이스 |
256 bit |
256 bit |
320 bit |
384 bit |
메모리 대역폭 |
62.1 GB/s |
57.6 GB/s |
64 GB/s |
86.4 GB/s |
103.7 GB/s |
메모리 용량 |
512 MB |
256/ 512 MB |
640/320 MB |
768 MB |
ROPs |
16 |
16 |
20 |
24 |
텍스쳐
필레이트 |
41.6 GT/s |
33.6 GT/s |
24 GT/s |
36.8 GT/s |
39.2 GT/s |
HDCP 지원 |
지원 |
HDMI 지원 |
지원 |
버스
인터페이스 |
PCI Express 2.0 |
PCI Express 2.0 |
PCI Express 1.1 |
TDP |
~150 W |
110W |
147 W |
177 W |
175 W |
가격 |
$299 - $349 |
$199 - $249 |
$349 - $399 |
$499 - $599 |
$699 |
G92 코어를 사용한 8800GT와 8800GTS는 이전의 G80 코어 제품들이 90nm 공정을 적용하고 있는 것과는 달리
65nm 공정을 적용하여 같은 크기의 다이에서 더 많은 코어를 생산이 가능하고 클럭을 향상시킬 수 있게 되었다. 따라서,
가격적인 부분과 클럭 상승에 따른 성능 향상, 그리고 공정 개선에 따른 발열 및 소비전력에서도 유리해졌다. 소비전력의 경우
G92기반 8800GT는 110W, G92 8800GTS는 최대 150W로 G80 기반의 8800GTX나
8800Ultra와 비교하여 낮아졌다. G92 코어 8800GTS의 경우 클럭 향상과 스트림 프로세서 증가 등에 따라
G92 코어 8800GT보다 소비전력이 높아졌다.
G92 코어를 사용한 8800GT와 8800GTS는 G80 코어 기반의 8800 시리즈와 비교하여 코어와 메모리 클럭을
비롯하여 쉐이더 클럭 역시 증가되었다. 대신, 메모리 인터페이스는 256bit로 낮아졌는데 이를 코어와 메모리, 쉐이더
클럭을 높임으로써 메모리 인터페이스 부족을 보완해준다. (G80 코어 8800GTS는 320bit, 8800GTX와
8800Ultra는 384bit 메모리 인터페이스를 가진다.)
스트림 프로세서 역시 G80 8800GTS 320/ 640MB가 96개, 8800GTX/ 8800Ultra가 128개를
가지는 것과 비교하여 G92 8800GT는 112개, G92 8800GTS는 128개를 가진다. 따라서, 메모리
인터페이스는 줄었지만, 클럭 향상 및 스트림 프로세서의 증가를 통해 G92 코어 기반의 8800GT와 8800GTS는 높은
성능을 기대할 수 있다. ROP 역시 G92 코어 기반의 8800GT/ 8800GTS는 16개, G80 8800GTS
320/ 640MB의 20개와 8800GTX/ 8800Ultra의 24개보다 줄어들었다.
HDCP 지원은 경쟁사의 HD 3800 시리즈와는 다르게 코어 내부에 이를 온칩화하지 않아 외부 HDCP 키롬을 이용하며,
HDMI는 코어 내부에서 이를 지원하고 있다. 또, G92 코어를 사용한 8800GT와 8800GTS는 PCI-Express
2.0을 지원하고 있어 PCI-Express 1.1 대비 더 높은 대역폭을 활용할 수 있다.
가격 부분 역시 G92 코어 8800GT가 G80 기반의 8800GTS 320/ 640MB보다 낮으면서 높은 성능을 보이고
있어 가격대 성능비가 좋다. G92 코어 역시 $299 ~ $349 사이의 가격을 형성할 것으로 알려져 G80 코어를
사용한 8800GTS 320MB 수준의 가격을 형성하면서 성능은 8800GTX를 위협하고 있다. 그러나, 성능과 함께
가격을 고려한다면 G92 코어 8800GTS 512MB보다 8800GT 512MB가 더 유리한 것은 사실이며, 국내에
출시된 G92 코어 8800GTS 512MB는 38만원 대를 기록하여 가격적으로 8800GT 512MB보다 불리한
입장이다.
G92 코어 8800GTS 512MB는 AMD ATI에서 등장할 HD 3870 X2 (RV670 코어 2개 사용) 버전을
견제하기 위해 등장한 것으로 볼 수 있으며, 먼저 등장한 만큼 가격적인 부분에서 유리하고 내년 등장할 것으로 알려진
NVIDIA DirectX 10.1 지원 그래픽 카드들이 등장하기 전까지의 공백을 매워 줄 수 있을 것으로 보여진다. |