특집기사 > 전체

긴급점검! 위기의 FX

/ 2

그래픽 카드의 절대강자로 군림하던 엔비디아의 행보에 적신호가 켜졌다. 야심차게 발표했던 지포스 FX 시리즈의 성능에 의문을 제기하는 사람이 많아지더니 급기야 얼마 전에는 게이머들 사이에서 최대의 기대작으로 평가받는 <하프라이프 2>의 개발사 밸브소프트웨어가 정면으로 지포스 FX의 성능에 대해 의문을 제기했기 때문이다. 과연 지포스 FX에는 어떤 문제가 있으며 앞으로의 행보는 어떻게 진행될 것인가.

차세대 그래픽 API의 표준 다이렉트 X 9.0

게임을 위한 3D 그래픽 API는 크게 오픈GL과 다이렉트 X로 양분되어 있다. 오픈GL이 주로 상업용 그래픽에서 널리 사용된다면 다이렉트 X는 게임용으로 마이크로소프트에 의해 꾸준히 버전업되면서 3D 게임에서 그 입지를 넓혀나가고 있다. 초기의 다이렉트 X는 그저 그런 화질과 성능으로 인해 개발사들로부터 외면받았으며, 실제로 각 그래픽 카드 제조사들은 고유의 API(부두의 글라이드 같은)를 개발해 사용하거나 오픈GL을 이용해 3D 그래픽(대표적으로 퀘이크 시리즈)을 구현했다. 하지만 다이렉트 X가 꾸준히 개선되면서 7.0 이후부터는 게임에 필요한 각종 효과를 충실히 표현할 수 있게 되었고 이를 통해 마이크로소프트는 게임용 3D API에서 독점적인 지위에 오를 수 있는 발판을 마련하게 된다. 이러한 과정에서 기존의 전용 API(글라이드 등)을 사용하던 대표적인 벤더인 3DFX사가 몰락의 길을 걷는 사건도 있었고, 상대적으로 다이렉트 X 환경에서 높은 성능을 발휘하던 엔비디아사의 리바 시리즈는 큰 성공을 거둔다.

결국 다이렉트 X 9.0에 이르러서는 이제까지 각 그래픽 칩셋 개발사들의 요구를 수용해 차기 버전을 개발해왔던 것과는 달리 마이크로소프트가 먼저 표준을 정한 다음 그래픽 칩셋 업체가 그것을 따르기를 요구하기에 이른다.

엄밀히 말하자면 표준이 먼저 정해지고 그것을 업계가 따르는 것이 올바른 절차이긴 하지만 이에 반발해 독자적인 길을 걷기 시작한 업체가 있었으니 아이러니컬하게도 다이렉트 X를 기반으로 큰 성공을 거두었던 엔비디아사다.

▶지포스 FX 시리즈가 강조하는 시네마틱 그래픽은 FP32 수준의 정밀도를 바탕으로 한다

엔비디아의 반란

다이렉트 X 9.0 표준이 확정되었을 때 가장 큰 논란을 불러일으킨 점은 FP(Floating Percision)의 정밀도(LOD: Level of Detail)를 몇으로 정하느냐는 부분이었다. FP LOD를 높게 잡으면 영상의 질이 올라가지만 그만큼 처리속도가 늦어지게 된다. 이 부분에서 3D 칩셋 벤더의 양대산맥이었던 엔비디아와 ATI의 의견이 크게 갈리게 되었는데 이미 쿼드로 제품군을 통해 상업용 시장을 장악하고 있던 엔비디아는 FP32를 채용해 높은 화질을 얻고, 일반적인 게임에서는 FP16 수준으로도 충분하기 때문에 빠른 속도를 얻을 수 있다는 입장이었다. 반면 마이크로소프트와 ATI의 입장은 FP16 수준은 앞으로 나올 차세대 게임에 사용되기에는 그 정밀도가 부족하고 FP32는 현재의 기술로 충분히 빠른 속도를 얻을 수 없으므로, 그 대안인 FP24모드를 표준으로 정하자는 쪽이었다. 결국 엔비디아는 이에 반발해 독자적인 3D 그래픽 프로그래밍 언어인 “Cg"를 발표하기에 이르고, 다이렉트 X 9의 표준은 FP24로 결정되게 되었다. 엄밀히 이야기하면 기술적인 진보를 이끌어내기 위한 시도는 엔비디아쪽의 손을 들어줘야 옳다. 하지만 표준(?)을 따라가지 않는 댓가는 상상 이상으로 클 수밖에 없었다.

 

▶엔비디아의 독자적인 그래픽 언어 “Cg"는 별개의 API가 아닌 다이렉트 X 나 오픈GL 등의 API를 지원하는 그래픽 프로그램 코딩 랭귀지다

FP32(FP16) VS FP24

정밀도가 32비트냐 24비트냐의 여부는 실제 게임에서 그다지 두드러지지 않는다. 왜냐하면 32비트의 정밀도는 모델링 퀄리티가 그만큼 따라줘야 진가가 발휘되는 것인데 애초에 게임에서 사용되는 폴리곤의 수가 제한적이기 때문이다. 반면 정밀도에 따른 속도의 차이는 크다. 이러한 단점을 지포스 FX는 높은 클럭속도로 극복하려 하고 있다(지포스 FX의 거대한 쿨러를 떠올려보면 이해가 갈 것이다). 이러한 이유로 인해 지포스 FX 시리즈의 최고급 모델인 5900의 경우 32비트의 정밀도를 가지는 파이프라인 4개에 각각 2개의 텍스처 유닛을 가지는 4X2의 쉐이더 유닛구조로 되어 있다. 라데온 최고모델인 9800 Pro의 8개의 파이프라인당 1개의 텍스처 유닛이 배당되는 8X1과는 다른 모습이다.

때문에 FX 5900의 경우 각각의 파이프라인은 32비트의 정밀도를 가지기 때문에 32비트 정밀도를 필요로 하는 작업에서는 4개의 파이프라인 구조로 작동하며, 라데온의 경우 24비트로 고정된 8개의 파이프라인 구조에서 작동하므로 FX쪽의 동작속도는 느려질 수 밖에 없다. 이러한 이유로 각종 벤치마크에서 FX 5900은 라데온 9800에 비해 현저히 떨어지는 점수를 기록하게 되며 많은 유저들과 게임 개발사로부터 성능에 대한 불신과 비난의 소리를 듣게 된다. 다급해진 엔비디아는 FP32와 FP24 정밀도를 직접 비교하는 것은 옳지 않으며 FX 5900은 하나의 32비트 정밀도를 가지는 파이프라인을 두 개의 16비트 정밀도를 갖는 가상 파이프라인으로 나눠 쓰는 기능이 있지만 아직 구현되지 않았기 때문에 그런 결과가 나타난다고 주장하기에 이른다.

그러던 와중에 <하프라이프 2>를 개발하는 밸브소프트웨어가 충격적인 발표를 하고야 만다. 자사에서 개발중인 게임 <하프라이프 2>를 위시한 다이렉트 X 9.0을 표준으로 이용하는 게임에서는 결코 지포스 FX 시리즈가 라데온 시리즈의 속도를 앞지를 수 없으며 자신들은 엔비디아가 제시하는 정밀도 관련 최적화를 모두 수행했음에도 불구하고(그로 인해 프로그래밍 시간이 5배나 더 걸렸지만) FX 시리즈에서는 만족할만한 속도향상이 이루어지지 않았다는 것이다.

▶하반기 최대의 기대작 하프라이프 2

▶하프라이프 2에서의 지포스 FX와 라데온의 성능차 / 출처 : gamersdepot

터져 나오는 불만

엎친데 덮친 격으로 얼마 전 미국에서 열린 쉐이더의 날 행사(Shader's Day)에 모인 많은 게임 개발자들은 그동안 가슴속으로만 끙끙대고 있던 지포스 FX의 쉐이더 성능문제에 대해 많은 의견교환을 했고 그 곳에서 나온 결론은 지포스 FX의 쉐이더 성능이 크게 떨어진다는 것이었다. 호러 게임으로 유명한 <사일런트 힐 3>의 개발자는 지포스 FX의 쉐이더 성능에 대해 다음과 같이 평가했다.

『어제 나는 길드포드에서 열린 ATI, MS, Intel 게임 개발자 회의에 갔었다…(중략)…그리고 다음날 하프라이프 2 벤치마크가 공개되었다. 벤치마크에 대한 이야기와 DX 9 쉐이더 성능에서 엔비디아가 허술하다는 가십은 이날 내내 계속되었다. ATI는 훨씬 앞서나가는 모습을 보며 전혀 놀란 표정이 아니었다. 하지만 그들도 다른 모든 게임 제작자들이 하프라이프 2의 결과와 자기들 게임의 결과가 일치하는 것을 보고 기뻐하는 모습은 예상치 못했을 것이다 …(중략)…하프라이프 2는 아마도 업계에서 가장 기대되는 타이틀일 것이다. 모두들 이 게임을 최상의 환경에서 돌리기 위해 총력을 기울이고 있다. 모든 사람들이 이들이 대단히 뛰어난 능력을 가졌음을 알고 있다. 만일 이들조차 제대로 된 결과를 내놓을 수 없다면, 이는 그들이 문제가 아니라 다른 데 문제가 있다고 모두들 생각하게 마련이다…(중략)…엔비디아 때문에 생긴 가장 기본적인 문제는 그들 때문에 다른 모든 사람들이 해야만 했던 추가적인 작업 때문이다. 벤치마크 회사는 치팅을 하고 있나 계속 살펴야 하고, 게임 개발자들은 절반수준의 성능을 위해 추가적인 프로그래밍을 해야 하고, 마이크로소프트는 WHQL 테스트를 강화해야 했던 것이다. 모든 사람들이 엔비디아의 실수 때문에 고통을 겪어야 했고 이것이 화가 난 이유다…(중략)…그들의 개X같은 짓거리를 우리가 대신 처리할 수는 없다…(중략)…그러니 이제 그딴 짓 하지 마라. 만일 당신네 카드가 뭔가 쓰레기 같다면 적어도 빠른 시일내에 고백해라. 우리가 1년 내내 당신네들이 사용하라고 한 기술을 모조리 적용하고 나서도 우리 게임에서 당신네 카드가 개같이 느리다는 사실을 발견하게 만들지 마라.』-출처 Beyond3d (www.beyond3d.com)

상당히 충격적인 내용이 아닐 수 없다. 사태의 심각성을 깨달은 엔비디아는 기존의 단지 4개의 32비트 정밀도를 갖는 파이프라인을 사용하는 드라이버가 아닌, 16비트 정밀도를 갖는 8개의 가상 파이프라인 기능을 사용할 수 있는 새로운 디토네이터 50 드라이버의 존재에 대해 서둘러 발표한다. 그리고 아직 정식으로 릴리즈하지는 않았지만 베타 버전이 유출(?)되어 있는 상태다.

▶이정도 화질을 구현하면서 높은 프레임 레이트를 유지하기란 쉬운 일이 아니다. 아니, 애초에 불가능했다?

디토네이터 50(포스웨어:Forceware)

많은 지포스 FX 사용자들은 디토네이터 50의 성능에 대해 기대 반 불신 반 하면서도 초조한 마음으로 기다렸다. 과연 엔비디아의 말대로 극적인 성능향상이 있을 것인가? 결과는 대단했다. 다이렉트 X 9.0을 사용하는 모든 게임에서 라데온 시리즈의 60%정도 성능만을 보였던 지포스 FX가 라데온과 동등하거나 미세하게 앞서는 성능을 보이게 된 것이다. 드라이버만으로 하드웨어적인 약점을 이렇게까지 극복해내는 것은 정말이지 놀라운 일이었다.

하지만 해외의 유수한 벤치마크 사이트에서 디토네이터 50이 이전 버전에 비해 화질을 미세하게 손상시키고 있음을 밝혀내고 이러한 화질의 감소가 속도증가로 이어지는 것이 아닌가에 대해 의문을 제기한다. 이에 대해서는 아직 드라이버가 정식 버전이 아니기 때문에 사소한 버그로 치부될 수 있다고 보는 게 지배적인 의견이지만 일종의 치팅(Cheating: 속임수)이 아니냐는 주장도 있다.

▶디토네이터 50을 포함한 각 드라이버 별 지포스 FX와 라데온의 성능 / 출처 : Guru3d

지금까지 유출된 디토네이터 50 드라이버는 총 4종류로써 버전이 올라갈수록 높은 성능과 안정적인 이미지 퀄리티를 보이고 있다. 최종적으로 정식발표될 디토네이터 50이 어떤 성능을 보일지는 아직 모르지만 지금까지의 결과만으로 미루어 보면 희망을 걸어봐도 괜찮을 것 같다.

▶왼쪽이 지포스 FX의 파이프라인 구조, 오른쪽이 라데온의 파이프라인 구조다. 한눈에 봐도 지포스 FX쪽이 훨씬 골아프게(?) 생겼다

실제 성능 테스트

이미 수많은 하드웨어 사이트에서 관련자료를 내놓은 상태지만 보다 정확한 결과를 위해 지포스 FX 5900과 라데온 9800 Pro의 성능 테스트를 실시했다.

다만 각종 벤치마크나 게임에서의 성능점수나 평균 프레임에 관한 자료는 널리 알려진 상태이므로 위의 자료로 대처하고 지금은 실제 게임에서의 체감성능에 대해 이야기하도록 하겠다.

테스트에 사용된 게임은 <둠 3> 알파 버전, <하프라이프 2> 유출 버전, <리니지 2>, <워크래프트 3: 프로즌 스론>이다.

사용된 하드웨어는 MSI의 지포스 FX 5900 울트라 버전과 기가바이트의 라데온 9800 Pro다. 독자들을 위해 테스트용 샘플을 제공해 준 기가바이트와 MSI측에 감사의 말씀을 전한다. 참고로 지포스 FX 5900 울트라는 디토네이터 52.13, 라데온 9800 Pro는 카탈리스트 3.8 드라이버를 사용했다.

둠 3 알파 버전

<둠 3>는 다이렉트 X를 사용하지 않고 오픈GL을 이용한 대표적인 차세대 게임이다. 비록 아직 알파 버전이지만 다이렉트 X를 사용하지 않는다는 점만으로도 지포스 FX쪽의 우세가 점쳐졌다.

결과는 예상대로 지포스 FX 5900 울트라가 좀 더 높은 성능을 보여줬다. 개발자이자 id소프트웨어의 대표인 존 카맥의 이야기를 들어보면, <둠 3>는 앞으로 화면의 오브젝트에 따라 쉐이더 정밀도를 선택적으로 적용하는 최적화 작업을 거칠 예정이기 때문에 정밀도가 16비트와 32비트의 2중 구조로 되어있는 지포스 FX에서는 정식 버전에서 추가적인 성능향상이 있을 예정이라고 한다.

하프라이프 2

<하프라이프 2>는 얼마 전 해킹사건으로 인해 소스 전체가 유출당하는 수난을 겪기도 했다. 이번의 테스트 역시 해커에 의해 유출된 버전을 통해 이루어졌다. 다이렉트 X 9.0을 표준으로 사용하는 대표적인 게임인 <하프라이프 2>는 예전의 선언사건(?)에서도 나타났지만 라데온 계열에 최적화된 게임이다(<둠 3>가 지포스 계열에 최적화 된 것과 비견된다고나 할까).

결과는 라데온 9800 Pro의 승리. 하지만 지포스 FX에서도 크게 느리다는 느낌은 받지 못했다(디토네이터 44.01버전으로 하프라이프 2를 구동했을 때와 비교하자면 말이다). 디토네이터 50의 최적화가 빛을 발하는 순간이라고 해석해야 옳을 것이다.

리니지 2

<리니지 2>는 다이렉트 X 8.1 수준의 게임이다. 픽셀 쉐이더를 지원하긴 하지만 1.2 수준이며 지포스 FX에서 문제가 되는 픽셀 쉐이더 1.4나 2.0은 지원하지 않는다.

결과는 어느 한쪽이 더 빠르다고 말할 수 없는 수준이었지만 보통 때는 지포스 FX가, 수면등의 반사효과가 사용된 곳에서는 라데온이 좀 더 빠르다는 느낌을 받았다. 쉐이더를 많이 사용하지 않는 장면에서는 지포스 FX의 높은 클럭이 상대적으로 위력을 발휘하는 것이 아닐까 예측해본다.

워크래프트 3 : 프로즌 쓰론

<워크래프트 3: 프로즌 쓰론>은 다이렉트 X 8.1 수준의 게임이지만 쉐이더가 전혀 사용되지 않았다. 순수하게 고전적인 폴리곤과 택스쳐들의 조합으로 게임의 그래픽을 성공적으로 구현한 대표적 게임이라고 할 수 있다.

결과는 우열을 가리기 힘들 정도로 비슷했지만 라데온 9800 Pro가 좀 더 빨랐다. 물론 이 게임이 애초에 느려지는 현상이 전혀 느껴지지 않을 정도로 그래픽 카드에게는 부담이 되지 않는 타이틀이지만, 유닛이 많이 모여있는 곳에서의 화면 스크롤이 얼마나 부드럽냐 같은 부수적인 요소로 테스트할 여지는 남아있다고 할 수 있겠다.

드라이버 최적화를 통한 성능향상. 차기 제품에서는 달라지는 모습을 보이기를…

분명 2중 구조의 정밀도를 갖는 지포스 FX의 쉐이더 유닛은 미래지향적인 모습임에 틀림 없다. 하지만 게임을 실행할 때의 실질적인 퍼포먼스가 저하된다면 아무리 진보된 개념이 들어갔다고 해도 유저들은 외면할 수밖에 없다. 비록 디토네이터 50을 통해 라데온과의 성능차이를 좁혀나가고 있기는 하지만, 부디 차기 칩셋인 NV40에서는 예전의 명성을 되찾을 수 있는 멋진 제품을 만들어주기를 기대한다.

▶현재 개발 중인 것으로 알려진 NV40의 모습

이 기사가 마음에 드셨다면 공유해 주세요
만평동산
2018~2020
2015~2017
2011~2014
2006~2010
게임일정
2025
11