2005년 12월 25일 일요일

X1300Pro, X1600XT 샘플 리뷰..

ATi의 새로운 라인업인 X1K계열의 제품들은 기존의 130nm공정보다 한단계 진보한 TSMC의 90nm공정으로 제조된다. 이로인해 동일 트렌지스터 수에 대비 기존의 공정보다 저전력 저발열 제품의 제조가 가능해 졌으며 수율만 따라 준다면 웨이퍼당 생산 가능한 칩의 수가 많아져 가격 절감에도 영향을 미치게 될 것이다.


지금부터 벤치마킹을 하게 될 제품은 X1300Pro와 X1600XT 그리고 보유하고 있던 X800XL 카드 이며 다음의 표에 세부 스펙을 기재하겠다.


 

Radeon X1600XT

Radeon X1300Pro

Radeon X800XL

코어

RV530

RV515

R430

제조공정

90nm

90nm

130nm

트렌지스터 수
(
단위 : 백만)

157

105

160

코어클럭(Mhz)

590

600

400

메모리클럭

690 GDDR3(1.38Ghz)

400 GDDR2(800Mhz)

490 GDDR3(980Mhz)

버스인터페이스

PCI-E x16

PCI-E x16

PCI-E x16

메모리버스

256비트(듀얼링버스)

256비트(듀얼링버스)

256비트

픽셀 쉐이더유닛

12

4

16

버텍스유닛

5

4

6

텍스쳐 메모리
(Mbyte)

256

256

256

지원API

DX 9.0c
쉐이더 모델 3.0
OpenGL 2.0

DX 9.0c
쉐이더 모델 3.0
OpenGL 2.0

DX 9.0b
쉐이더 모델 2.0
OpenGL 1.5


제품외형


(위로부터 X1300Pro, X1600XT 그리고 X800XL. 이미지를 클릭하면 확대된 이미지를 볼 수 있습니다.)


PCB의 색상은 모두 ATi 특유의 붉은색 PCB가 사용되었고 X1800을 제외한 하위 제품의 크기는 모두 하나의 슬롯을 사용한다. 기존의 X800계열보다 PCB의 크기도 작아졌으며 이로 인해 PC내부에 좀더 여유 공간을 확보 할 수 있을 것으로 보여진다. X1600의 경우 듀얼 DVI포트를 지원하며 D-SUB출력단은 기본적으로 제외된 상태였다. X1300과 X1600의 보드 레이아웃은 흡사한 형태이지만 컴포넌트 수, 종류 그리고 배치가 달랐으며 메모리의 경우 X1300은 앞면과 뒷면 모두 존재 하였지만 X1600은 메모리가 모두 앞면에 위치한 것도 특징 이었다.


X1300Pro 전면부 이미지

X1600XT 전면부 이미지


X1300Pro 후면부 이미지

X1600XT 후면부 이미지


(제품의 제조일과 리비젼 상태를 알려주는 스티커)

(코어 이미지. X1600XT의 경우 코어도 엔지니어링 샘플이었으며 90nm공정의 도입으로 인해 코어와 칩셋 크기가 기존의 제품에 비해 줄었다.)

(FBGA타입의 메모리. X1300Pro의 경우 2.5ns동작 속도에 최고 400Mhz의 클럭을 갖는 GDDR2 메모리인 인피니언의 HYB18T256161AF-25 메모리를 사용하였고 X1600의 경우 1.25ns동작 속도에 최고 800Mhz 의 클럭을 갖는 GDDR3 메모리인 삼성의 K4J52324QC-BJ12 메모리를 사용하고 있다.)


리뷰를 하게된 두제품 모두 샘플 상태여서 리뷰를 하는 동안 몇가지 문제가 있었는데 X1600의 경우 현제 사용중인 BenQ FP91G+ 모니터와 DVI신호의 호환성 문제로 D-SUB 변환 젠더를 사용해서 테스트를 진행 하였으며 테스트에 사용된 Catalyst 5.9 베타 드라이버 또한 드라이버 상의 버그가 눈에 띄었다. 이런점들 모두 실제 시장에 출시되는 시점에 바이오스 업데이트 또는 보드 리비젼 그리고 드라이버 업데이트를 통해서 해결할 것 으로 보이며 흥미로운 점은 X1600의 메모리가 상당한 여유 클럭을 가지고 있어서 쿨링에 좀더 신경만 써준다면 오버클럭을 통해 상당폭의 성능 향상을 얻을 수 있을것으로 보인다.


테스트 시스템 셋업


벤치마크를 위해서 사용된 시스템의 사양과 설정 사항은 다음과 같다.



CPU

Athlon64 Venice Core 3200+ / @2.05Ghz

MOBO

MSI K8N Neo4-Fi / Nforce4 Ultra

RAM

Corsair TwinX 1024XL 512 x 2 Dual Channel / Latency 2-2-2-5 1T, FSB 410

PSU

Tagan TG420-U01 /420W

SOUND

Soundblaster Audigy2 ZS

HDD

WesternDigital WD1600JS SATA2 160G x 2 / RAID0

Monitor

BENQ FP91G+

OS

Windows XP Service Pack2



드라이버 :

  • Catalyst 5.10a Hotfix Beta Driver @X800XL
  • Catalyst 8.173(5.9 Beta) @X1300Pro, X1600XT


X1K계열의 제품의 경우 정식 드라이버가 없는 관계로 제공받은 5.9 Beta드라이버를 사용하게 되었으며(X1600의 경우 베타라기보단 알파라는 느낌이 들었다. -_-;) 노멀 셋팅값은 다음과 같다.



세카드에 동일한 셋팅을 하였으며 Vsync와 스마트쉐이더 효과는 모두 OFF상태이다.


벤치마킹 소프트웨어 :


  • 3DMark03, Build 3.6.0 (DirectX)
  • 3DMark05, Build 1.2.0 (DirectX)
  • SPEC Viewperf 8.1 (OpenGL)
  • ShaderMark 2.1 (DirectX)
  • Quake 4 1.0 (OpenGL)
  • Doom III 1.3 (OpenGL)
  • Far Cry 1.33 (DirectX)
  • F.E.A.R. 1.0 (DirectX)


세 카드 모두 하이엔드급이 아닌 미드레인지와 로우엔드 제품임을 고려 모든 테스트는 실제 게임 플레이시 가장 많이 사용할 해상도라 판단되는 1024x768 모드로 통일하여 테스트 하였으며 SPEC Viewperf의 경우만 창모드로 실행되어 1280x1024의 해상도에서 테스트 되었다.


벤치마킹


3DMark03 :



테스트 설정은 디폴트 값을 적용하였으며 CPU와 SOUND 테스트 부분은 제외하였다. X800XL의 경우 완숙단계에 들어선 드라이버 퀄리티라는 점을 감안하면 X1600XT의 경우 앞으로 어느정도 까지 성능을 끌어 올려줄지가 주목된다. 또한 X1300Pro의 경우 파이프라인 대비 효율은 매우 좋은 편이라 평가된다.


3DMark05 :



역시 테스트 설정값은 디폴트 값을 주었으며 CPU 테스트 또한 제외 하였다. 눈에 띄는 점은 X1600XT가 3DMark03의 결과와는 달리 X800XL과 거의 근접한 점수를 기록하고 있다는 점이고 X1300Pro의 경우 다른 두 제품의 절반정도의 점수를 보여주고 있다. 덧붙여 X1600XT의 경우 몇차례 드라이버의 버전업이 되면 X800XL보다 높은 점수를 얻을 수 있을것으로 보인다.


SPEC Viewperf 8.1 :



실질적인 OpenGL생산성 벤치마크인 SPEC Viewperf 8.1 테스트 결과다. 앞에서 언급한 것과 같이 1280x1024의 데스크탑 해상도 상에서 테스트 되었으며 주목할 만한 점은 뷰포트 가속에 있어 X1300Pro의 경우 X800XL과 비슷하거나 오히려 조금 앞서는 부분도 있었다. ATi계열 카드를 사용하고자 할때 좀더 저렴한 가격대에 OpenGL작업을 하길 원하는 사람에게 추천할만한 사항이다. X1600XT의 경우 비교 카드와 대비해 전체적으로 좋은 점수를 보여주고 있다.


ShaderMark 2.1 :



쉐이더마크는 마이크로소프트사의 DirectX 9.0 쉐이더 처리능력을 벤치마킹하는 프로그램이다. 테스트에 앞서 기본 설정은 디폴트로 하였으며 X1K계열은 쉐이더 모델 3.0을 지원하여 모든 테스트를 통과 하였으나 X800XL은 쉐이더 모델 2.0 카드이기 때문에 Dual Layer 8x8 PCF Shadow Mapping with Flow Control 그리고 High Dynamic Range Shader - high quality with fp filtering 테스트를 통과할 수 없었다.


실제 테스트 또한 X1K계열은 픽셀 쉐이더 3.0으로 X800XL의 경우 2.0을 이용하여 테스트 되었으며 적은 수의 쉐이더의 처리에 대한 프레임은 X800XL이 높게 나왔으며 복합적인 쉐이더 처리에선 X1K계열의 처리능력이 조금은 효율적인 면을 보였지만 테스트한 제품간에 지원하는 쉐이더 모델의 버전이 달라 비교하기가 조금 애매하였다. X1600XT의 경우 X800, 850계열을 대체하기 위한 제품이기 때문에 개인적으로 추후 드라이버의 버전업에따른 쉐이더 처리능력의 향상이 어느정도까지 있을지 기대를 해본다(여러 테스트 간에 X1600의 드라이버가 X1300보다 완성도가 더 떨어지는 면을 보였다.).


게임 벤치


Quake 4 :



항상 VGA카드 성능의 벤치마크 척도가 되어온 퀘이크 시리즈의 최신작인 퀘이크4의 벤치마킹이다. 기본적인 셋팅은 디폴트 셋팅에서 하이퀄리티 옵션을 적용한 1024x768의 해상도로 테스트 하였으며 프레임 제한을 풀기위해 콘솔상에서 com_fixedTic 1을 적용하였다. 퀘이크4의 경우 둠3와는 달리 타임데모가 존재하지 않아 싱글플레이의 일부를 데모로 녹화하여 타임데모 벤치를 하였다. 또한 울트라 퀄리티의 경우 텍스쳐 메모리가 500Mbyte 이상이 아닐 경우 경고 메시지가 뜨게되어 테스트를 할 수 없었는데 역시 퀘이크4 라는 생각이 들었다. 테스트시 X1K계열의 경우 프레임이 대체적으로 일정하게 유지되었던 반면 X800XL은 프레임 변화 폭이 상당히 큰편이었다.


Doom III :



VGA 벤치마크 하면 빠지지 않는 것이 바로 둠3이다. 둠3 엔진은 퀘이크4 엔진의 모체이기도 하니 어느정도 비슷한 결과가 나오리라 예상하고 벤치에 들어갔으며 디폴트 셋팅에 울트라퀄리티를 적용한 1024x768의 해상도에서 테스트를 하였다. 역시 프레임 제한을 풀어주기 위해 콘솔상에서 com_fixedTic 1을 적용하여 타임데모를 돌렸다. 예상했던 것과 같은 양상의 결과를 얻을 수 있었다.


Far Cry :



Far Cry의 테스트는 "farcry.exe -devmode" 실행후 테스트용 데모를 기본 설정에서 Very High 옵션을 준 상태에서 돌렸으며 테스트간 특이사항으로는 X1600XT의 경우 드라이버 상에 약간의 버그로 인해 수면의 표현이 부적절한 모습을 보였다. X1600XT의 경우 X800XL과 거의 비슷한 평균 프레임을 보여 주었으며 X1300Pro또한 다른 테스트와는 달리 비교카드와 대비해 좀더 나은 프레임률을 보여주고 있다(ATi의 제품들은 대체로 D3D 게임에서 강한 면모를 보여준다.). 추후 드라이버의 완성도가 높아지면 X1600XT의 경우 X800XL을 가볍게 제칠수 있을 것으로 보인다.


F.E.A.R. :



F.E.A.R. 테스트의 기본 설정은 퍼포먼스 탭의 컴퓨터와 그래픽카드 모두 High로 설정하고 F.E.A.R. 설정탭의 그래픽 카드의 세부설정 부분의 안티알리이싱과 비등방성필터링 옵션이 활성화 되어있던 부분을 모두 OFF로 설정하고 테스트 퍼포먼스 메뉴를 이용하여 진행 하였다. 결과의 양상은 퀘이크4나 둠3와 비슷한 양상이었다.


게임 벤치의 경우 제작사의 패치 그리고 ATi의 드라이버 지원으로 추후 성능의 향상을 기대할 수 있는 부분이다. 현제 샘플 드라이버의 벤치결과는 다소 실망스러운 감도 있지만 X1600XT의 경우 추후 완성도 높은 드라이버와 함께 선전을 기대해 본다.


화질의 향상


ATi는 신제품의 출시와 함께 HDR렌더링, 고화질 비등방성필터링(이하 QAF) 그리고 적응형 안티알리아싱(이하 AAA) 기술을 선보였으며 세 기술의 적용이 어떠한 이점을 갖는지 알아보도록 하자.


HDR(High-Dynamic Range) 렌더링 :


기 존의 32비트 정수 컬러포멧은 빨강, 녹색 그리고 파란색의 색상당 8비트값을 사용하여 256 단계의 색상을 표현 할 수 있었지만 X1K계열의 카드는 HDR렌더링의 도입으로 인해 64비트 부동소수점 색상 처리가 가능해져 인간이 인지할 수 있는 모든 범위의 색상과 명도의 표현이 가능해졌다.


(데이터 포맷대비 실재 사람이 인식할 수 있는 컬러의 범위.)


이로 인해 인간의 눈의 동작 원리와 같은 광원 효과의 적용이 가능해졌는데 인간의 눈은 어두운 곳에서 매우 밝은 빛을 보게될 경우 위 이미지의 Cones 영역의 영향으로 빛의 밝기가 순간적으로 더 밝게 느껴지다(밤 하늘에 쏘아올린 조명탄을 상상해 보자.)차차 적응하게 된다. 이와 같은 원리를 이용 HDR렌더링을 이용한 다음과 같은 빛의 사실적인 표현이 가능해 졌다.


(기존의 32비트 정수 컬러사용 대비 HDR렌더링의 사용으로 인해 좀더 다양한 광원 효과를 얻을 수 있다.)


(이런 느낌의 광원 효과가 가능하게 된다.)


고화질 비등방성필터링(Quality Anisotropic Filtering) :


기존의 AF기술은 알고리즘상 특정각에 의존하여 처리하기 때문에 일부 처리되지 않는 부분들이 발생 하였지만 QAF는 이러한 점을 개선하여 모든 화면에 걸쳐 필터링된 최적의 이미지를 제공한다.


적응형 안티알리아싱(Adaptive Anti-Aliasing) :


기 존의 멀티샘플 안티알리아싱(MSAA)방식은 격자나 철망 같은 부분의 처리에 비 효율적인 면이 있었지만 ATi는 AAA의 사용을 통해 이러한 부분에 대해 선택적인 슈퍼샘플링을 시도하는 알고리즘을 도입하여 성능과 화질의 두가지 사항을 모두 개선하게 되었다.


(기존의 방식과 AAA방식의 비교 이미지.)


더불어 이러한 모든 처리에 HDR렌더링의 관여로 기존의 제품보다 좀더 생생한 화질을 제공할 수 있게 되었다.


X800XL Vs. X1K 이미지 퀄리티 :


HDR렌더링 적용




HDR렌더링을 이용한 광원 효과가 적용될만한 곳을 찾아보았지만 드라이버상의 문제인지 아니면 게임상에 새로운 패치가 필요한건지 정확히 구현되지 않은 듯 보였다. 이는 추후 해결 되어야할 문제로 보인다.


QAF와 AAA






두 계열의 비교 이미지를 보면 확실한 화질의 향상을 느낄 수 있을것이다. 혹시 차이점을 찾기 힘들다면 AF와 QAF의 차이는 철망 넘어의 바닥이나 건물옆의 바위들을 유심히 보면 차이가 있음을 발견 할 수 있으며, TAA와 AAA의 차이는 철망을 유심히 보면 차이점을 발견할 수 있다.


화질 대비 퍼포먼스 :


게임의 플레이에 있어 높은 퀄리티의 화질은 게임의 사실성을 살려 몰입도를 향상 시켜주는데 도움이 될 것이다. 하지만 이것도 퍼포먼스의 하락이 너무 심하면 무용지물이니.


ATi 의 AF기술은 이미 예전부터 성능하락의 폭은 적음에도 불구하고 높은 화질을 제공하는 것으로 정평이 나있다. 기존의 기술에 대비해 새로운 기술인 QAF와 AAA의 성능 하락폭은 어느 정도일지 기존의 AF, TAA와 비교해 보도록 하겠다.


3DMark03의 게임벤치 부분인 Wings of Fury와 Battle of Proxycon을 사용하여 테스트를 진행 하였으며 결과는 다음과 같다.



모두 디폴트 설정값과 1024x768의 해상도에서 테스트 하였으며 결과를 보면 기존의 AF, AA 알고리즘에 대비해 X1K에 새롭게 적용된 QAF와 AAA의 프레임 하락률이 적다는 것을 확인할 수 있다. 이를 통해 화질 뿐만 아니라 AF와 AA 알고리즘의 효율성 또한 높아진 것을 확인하였다.


전체적인 3D 벤치를 통해서 X1600XT가 그다지 선전을 하지 못한게 조금 아쉽기도 하지만 X1K 계열의 경우 SPEC Viewperf벤치를 통해 3D생산성이 기존의 제품에 대비해 좀더 향상된 것을 확인할 수 있었으며 쉐이더 모델 3.0을 지원하기 시작 했다는점 그리고 새로운 AF와 AA알고리즘의 선전을 통해 앞으로의 드라이버 지원을 통한 성능 향상에 대해 어느정도 희망을 갖을 수 있었다(X1600의 드라이버는 메모리 클럭조차 비정상으로 표기되고 3D설정탭의 미리보기 화면조차 작동하지 않았다 -_-;) 또한 X1300Pro 의 경우 가격대만 적당하게 출시된다면 현재 시장의 9x00계열부터 X700사이의 카드를 모두 대체할 만한 훌륭한 메인 스트림 카드가 될 것으로 예상된다.


번외 벤치


X1300Pro를 처음 설치하면서 바로 눈에 띄었던게 Avivo디스플레이(본 리뷰의 전반부의 Avivo 관련 부분을 참고하기 바람.)의 적용으로 뭔가 다르다! 라는걸 한눈에 알아보았는데 이와 관련해 Avivo의 적용과 2D처리 능력의 변화등에 대한 궁금증의 증가로 인해 몇가지 테스트를 해보게 되었다.



동일한 모니터상의 DVI출력을 찍은 이미지이다. 위의 두 이미지로는 인식하기 조금 힘들지도 모르겠지만 일단 X1K계열의 특징은 색감이 좀더 강조되어 문자들이 눈에 확띄는 느낌이 들며 문자의 외곽또한 필터링을 걸어준 듯이 깔끔해진 느낌이 들었다.


(CCC 상의 Avivo 설정탭. 현재로서는 기존의 설정탭에 이름만 바뀐 상태였으며 아직 모든 기능이 완벽히 구현되지 않은것으로 보인다.)


과거의 ATi 제품들에는 색감 하면 ATi라는 수식어가 붙었었지만 최근 디지털 패널의 대중화 추세에 따라 의미가 퇴색되는 분위기였었다. 하지만 이러한 부분으로 볼때 Avivo를 통해 다시한번 화사한 색감을 제공 할 것 으로 기대해본다.


그밖에 Avivo를 통한 동영상 필터링 기법의 향상 여부와 CPU점유율 하락에 대해 몇가지 조사를 하게 되었는데 결과는 다음과 같다.





동영상 플레이어는 FullStream의 지원과 함께 ATi와 전략적 제휴를 함께해온 Real사의 Real플레이어 10.5를 이용하였으며 코덱은 ffdshow 코덱에 후처리 옵션은 전혀 주지 않은 상태이다. H.264와 같은계열의 호환 코덱인 X.264로 인코딩된 동영상으로 테스트를 하였다. 아쉽게도 둘의 차이점은 찾기가 힘들었다.



또한 CyberLink사의 PowerDVD를 이용하여 DVD재생 테스트를 하였는데 설정상의 하드웨어 디코딩 옵션을 활성화 시킨 상태로 진행 하였다. 역시나 아쉽게도 둘의 차이점은 찾기 힘들었다.


이밖에도 여러 코덱형식의 동영상으로 비교를 시도 하였으니 둘의 차이를 느낄 수 없었던 점으로 보아 해외 A모 사이트의 벤치에서 언급한 것과 같이 아직 Avivo의 기능이 정상적으로 구현되지 않은 듯 보였다. 분명 Avivo의 하드웨어 적인 구현은 눈에 띄었지만 동영상 필터링 부분과 같은 드라이버 차원의 문제는 출시전에 분명히 해결되어야할 문제로 보인다.


그밖에 PCMark05의 2D벤치 부분도 돌려보았는데 결과는 다음과 같았다.


X800XL

X1300Pro

X1600XT


테스트 결과를 통해 기존의 아키텍쳐 대비 2D처리의 효율성도 향상되었음을 확인 할 수 있었다. 이는 향상된 코어와 메모리 컨트롤러의 영향으로 볼 수있다.


리뷰를 마치며..



올해는 ATi의 설립 20주년을 맞는 해이다. ATi는 X1K계열의 아키텍쳐를 공개하였으며 수많은 새로운 시도들을 하고 있다.  GPGPU 프로젝트와 같이 물리연산에 GPU의 활용을 통한 그래픽카드의 범용성을 끌어내는 시도가 그러하며 얼마전에는 GPU의 세계최초 1GHz 클럭 돌파라는 오버클럭 신기록도 세워(물론 질소 냉각과 같은 특수한 방법을 사용하긴 하였다.)세간의 이목을 끌기도 하였다. 크로스파이어의 도입 그리고 Avivo 이러한 것들 역시 특별하다.


VGA업계에서 20년이면 짧지 않은 시간이다 바로 이러한 시간동안 수많은 노하우를 쌓은 ATi는 혁신적인 아키텍쳐의 X1K계열의 제품으로 다시한번 시장의 주도권을 찾아오기 위해 노력하고 있다.


X1K 계열의 카드는 그 기대만큼이나 다양한 기술과 출시와 함께 다양한 소식들로 우리의 기대를 사고 있다. 그 시점에 아직 출시에 조금 여유가 있는 제품들을 입수하여 벤치마크를 하고 소개 할 수 있었다는 점이 꽤 흥미 있는 작업 이었다.


메인스트림카드를 대체할 X1300Pro와 퍼포먼스 제품군을 대체할 X1600XT. X1300Pro의 경우 국내에서 가격만 적절하게 책정된다면 9x00계열부터 X700사이의 카드를 대체할 만한 성능을 충분히 가지고 있다. 그리고 X1600XT의 경우는 아직 드라이버의 상태가 불안전한 점을 감안 출시 직전까지 ATi의 드라이버 완성도가 어느 정도까지 향상 될 수 있는지가 중요한 관건으로 보이며 역시 X800, X850계열을 대체할 만한 잠재력을 가지고 있는 것만은 사실이다. ATi역시 이점을 인지하고 있을 것이며 최선을 다해 주리라 믿는다.


또한 드라이버의 지원을 통한 Avivo의 완전한 구현이 3D게이머가 아닌 일반 멀티미디어 PC의 사용자가 주인 메인스트림 시장 성공의 관건이지 않을까 싶다. Avivo 디스플레이를 통해 확인 할 수 있었던 색감의 변화또한 다시한번 예전의 명성에 도전하는 계기가 될 것으로 보인다.


현재 X800의 경우 리눅스 드라이버의 지원을 통해 MS 윈도우즈 이외에 오픈소스 진영의 리눅스 플렛폼도 지원하고 있다. 하지만 이제 출시된 X1K계열의 경우 아직 드라이버가 제공되지 않고 있다. 이점 역시 지원은 하겠지만 얼마나 빠른 시일내에 지원하게 되는지가 관건이다.


(X800XL의 리눅스 드라이버 제어판)


또한 크로스파이어의 국내 보급에 있어 지원이 미비하다는 점이 한편으로는 아쉽기도 하다 이미 해외 벤치에선 그 효율성에 대해 상당히 좋은 평을 받고 있지만 아직 국내에서는 그를 지원하는 메인보드의 보급이 더디며 지원하는 카드조차 보기 힘들다.


이런 모든 문제를 접어 두고라도 결국 제품을 선택하는건 소비자의 몫이다. ATi의 신제품에 관심을 갖고 있는 모든 분들에게 이 리뷰가 실제 제품의 선택과 구입에 도움이 되어주길 바라며 리뷰를 마치고자 한다.


p.s 기타 리뷰와 관련한 문의 사항이나 지적사항들은 이메일 또는 irc.hanirc.org의 #ATiMania 채널의 yish를 찾길 바란다.

2005년 12월 22일 목요일

ATi Catalyst Suite 5.13 Released ~*


> Catalyst™ 5.13은 다음을 포함합니다.:

    * Radeon® display driver 8.203
    * Multimedia Center™ 9.08
    * HydraVision™ 3.25.0006
    * HydraVision™ Basic Edition 3.25.9006
    * Remote Wonder 3.02
    * WDM Driver Install Bundle
    * Southbridge/IXP Driver
    * Catalyst® Control Center Version 5.13

! CCC를 설치하기 위해서는 반드시 닷넷프레임웍스 1.1이 설치되어 있어야 합니다.

! Remote Wonder™ 3.02 소프트웨어는 Remote Wonder™ 와 Remote Wonder™ II를 지원합니다. Remote Wonder™ Plus 사용자는 제품과 동봉된 드라이버를 사용 하시기 바랍니다.

* ATi WDM 드라이버 설치본에는 ATi WDM 드라이버 8.20과 4.07을 모두 포함하고 있으며 설치 프로그램은 ATI All-in-Wonder®또는 ATI VIVO™ 제품을 자동 감지하고 시스템에 맞는 ATi WDM 컴포넌트를 자동 선택 설치합니다.

WDM 8.20 이 설치되는 제품들:

    * All-in-Wonder® X1800 Series
    * All-in-Wonder® X800 Series
    * All-in-Wonder® X600 Series
    * All-in-Wonder® 9800 Series
    * All-in-Wonder® 9700 Series
    * All-in-Wonder® 9600 Series

WDM 4.07(6246)이 설치되는 ATi 제품들:
? Radeon® 9200 계열 또는 하위 All-in-Wonder® 제품들.
? ATI VIVO™ 제품들.

> Catalyst™ 는 다음의 ATi 데스크탑 제품을 지원합니다:

    * Radeon® X1800 series
    * Radeon® X1300 series
    * Radeon® X850 series
    * Radeon® X800 series
    * Radeon® X700 series
    * Radeon® X600 series
    * Radeon® X550 series
    * Radeon® X300 series
    * Radeon® 9X00 series
    * Radeon® 8500 series
    * Radeon® 7X00 series

> Catalyst™는 다음의 ATi 칩셋 제품을 지원합니다:

    * Radeon® Xpress 200 series
    * Radeon® 9000 IGP
    * Radeon® 9100 IGP
    * Radeon® 9100 IGP Pro
    * IXP 300

> Catalyst™ 5.13은 다음의 FireMV™ 제품들의 2D드라이버를 지원 합니다:

    * FireMV™ 2400
    * FireMV™ 2200 PCIe
    * FireMV™ 2200

> 최신 버젼의 Catalyst™소프트웨어는 다음의 MS윈도우즈 플렛폼을 지원합니다:

    * Windows XP
    * Windows XP Media Center Edition (graphics driver support only)
    * Windows 2000

> 새로운 기능들

H.264 하드웨어 가속

Catalyst® 5.13은 ATI Radeon® X1800, X1600 그리고 X1300 제품 라인에 대해 H.264 하드웨어 가속을 지원 합니다. H.264는 기존의 Mpeg2, Mpeg4와 같은 기존의 표준 포멧에 대비해 비트레이트가 줄은 향상된 비디오 코딩을 제공합니다. The ATI Radeon® X1800, X1600 그리고 X1300 제품군은 H.264를 사용하여 인코딩된 고화질 컨텐츠에대해 하드웨어 가속을 지원합니다. Catalyst® 5.13과 함께 다음의 페이지에 제공하는 http://www.ati.com/technology/h264.html Cyberlink H.264 decoder를 통해 H.264 하드웨어 가속을 지원합니다.

ATi RADEON X1800의 ATi CrossFire 지원

The Catalyst® 5.13은 ATI Radeon® X1800 제품에 대해 CrossFire를 지원 합니다.

HQV 비디오 벤치마크 지원

The Catalyst® 5.13은 HQV DVD 벤치마크를 완벽히 지원합니다. 이 드라이버 트윅을 통해 향상된 DVD 이미지 퀄리티와 좀더 높은 벤치마크 점수를 제공합니다.

* 그밖의 개선된 사항과 밝혀진 문제점은 원문을 참고 하시기 바랍니다

다운로드 : ATi.com의 메인페이지의 드라이버 & 소프트웨어 페이지를 참고 하시기 바랍니다.

Catalyst™ CREW Driver Feedback : https://support.ati.com/ics/support/default.asp?deptID=894&task=knowledge&questionID=737-1713

출처 : https://a248.e.akamai.net/f/674/9206/0/www2.ati.com/drivers/Catalyst_513_release_notes.html

2005년 12월 13일 화요일

ATi X1K 계열의 새로운 도약 - 쉐이더 모델3.0 -

쉐이더 모델 3.0


 Nvidia사 와 대비하여 기존의 Radeon 제품이 많은 지적을 받은 부분이 바로 쉐이더 모델 3.0의 지원여부였으며 이에 부응해 ATi는 X1K 제품군에 쉐이더 모델 3.0을 도입하게 되었다. 또한 ATi는 X1K계열의 쉐이더 모델 3.0 기술이 Nvidia와 대비해 동일또는 더 뛰어남을 시사하였으며 쉐이더 모델 3.0의 구현에 있어 ATi는 데이터의 흐름 제어와 128비트(FP32) 렌더링 부분의 최적화를 위해 다음과 같은 기술들을 도입하였다.


Ultra-Threaded 픽셀 쉐이더 엔진


RV530


RV515


메모리 제어 부분에 있어서 내부 지연시간을 줄이기위해 캐쉬와 작업중재 로직을 개선한 것과 같이 쉐이더 모델 3.0의 구현에 있어서도 지연시간과 낭비되는 사이클을 줄이기 위해 도입한 것이 있으니 바로 Ultra-Threaded 픽셀 쉐이더 엔진이다.


Ultra-Threaded 픽셀 쉐이더 엔진은 텍스쳐 어드레스 유닛/텍스쳐 유닛 그리고 픽셀 쉐이더 코어 사이에 위치하여 작업 스케쥴러 역할을 하게 되며 기존의 아키텍쳐와 다른점은 다음과 같다.


 과거의 픽셀 쉐이더 코어의 경우 픽셀 쉐이더에서 준비되지 않은 텍스쳐(텍스쳐 캐쉬에도 존재하지 않는)나 텍스쳐 결과물의 연산이 아직 완료되지 않은 텍스쳐를 호출할 경우 대기시간을 유발하고 많은 작업 사이클이 낭비되는 단점이 있었다.


하지만 Ultra-Threaded 픽셀 쉐이더 엔진은 이러한 문제점을 해결하기 위해 쉐이더 프로그램의 텍스쳐를 요구하는 명령을 받았을 때 기존의 방식과 같이 대기 시간을 갖는게 아니라 요청된 텍스쳐를 처리하던 픽셀 쉐이더 코어는 기존과 같이 잠시 유휴 시간을 갖게 되지만 이상황을 바로 스케쥴러가 감지하여 현제 사용되지 않는 다른 픽셀 쉐이더 코어에서 다른 쓰레드를 처리할 수 있게 하여 지연시간이 없이 작업이 처리될 수 있도록 하여준다.


또한 임시 쓰레드의 경우 다목적 레지스터 어레이에 저장되는데 이는 읽기/쓰기 작업이 동시에 가능하며 높은 대역을 제공하여 픽셀 쉐이더 코어의 빠르고 정확한 쓰레드 전환을 가능하게 도와준다.


ATi 는 이와 함께 픽셀 쉐이더 모델 3.0의 중요한 기능중 하나인 동적 분기(Dynamic Branching)의 향상을 위해 노력하게 되었는데 이는 동적분기를 하게 됨으로써 프로그램이 이미 계산되어진 값의 분기를 가져다 사용할 수 있게하여 연산해야할 쉐이더 코드를 줄여주어 성능을 향상 시킬수 있는 방법이지만 과거의 아키텍쳐상에서는 이러한 연산과정에 오류가 발생할 경우 많은 부하가 걸리고 속도의 저하를 야기하게되는 문제가 있었다.


이러한 문제를 해결하고 동적 분기의 정확한 동작을 위해서 ATi가 고안한 것은 먼저 쓰레드의 사이즈를 줄이는 것 이었다. 그러한 결론에 의해 쓰레드의 크기를 4x4의 픽셀 블록(16픽셀)의 작은 크기로 줄였으며 하나의 경로에 같은 형태의 쓰레드가 전송되야할 확률을 늘려 한번 사용했던 쓰레드의 픽셀셋을 다음의 다른 쓰레드의 픽셀셋 처리에 대치하여 연산해야할 데이터의 양을 줄였다. 또한 이러한 작업을 수월하게 처리하기 위해 X1K계열의 칩은 빠른 접근이 가능한 충분한 양의 레지스터 공간과 효율적이고 지연시간을 최소화한 캐쉬를 보유하고 있다.



이에 추가로 쓰레드 사이즈를 줄이는 작업을 전담하는 분기 실행 유닛을 픽셀 쉐이더 코어에 내장하여 분기 명령 처리시의 픽셀 쉐이더의 부하를 줄여 데이터의 소통을 원할하게 돕고 있다.


픽셀 쉐이더 처리기


Radeon X1K 계열의 픽셀 쉐이더 처리기는 3개의 벡터 컴포넌트를 갖는 2개의 벡터연산과 2개의 실수 연산을 매 사이클 마다 처리할 수 있으며 더불어 앞에서 언급한 것과 같이 각 코어는 분기 실행 전담유닛을 보유하고 있다. 또한 각각의 쉐이더 처리유닛마다 텍스쳐 주소 유닛이 하나씩 할당되어 있으며 이런 픽셀 쉐이더 처리기 4개가 하나의 그룹으로 묶여 쿼드 픽셀 쉐이더 코어를 구성하게 된다. 이러한 구성에따라 X1800에는 4개 X1600에는 3개 X1300에는 1개의 쿼드 픽셀 쉐이더 코어를 내장하게 되었다.


(쿼드 코어 픽셀 쉐이더의 다이어그램.)


버텍스 쉐이더 처리기


버텍스 쉐이더 처리기의 경우 기존의 방식을 그대로 물려 받았으며 달라진 점 이라면 버텍스 쉐이더 3.0 규격을 만족시키기 위해 동적 흐름제어 기능의 지원, 더많은 임시 저장 레지스터의 보유 그리고 좀더 긴 명령어를 처리할 수 있게 되었다는 점이 향상된 부분이다.


(버텍스 쉐이더 처리기의 다이어그램.)


128비트 부동 소수점 렌더링


X1K계열의 카드는 쉐이더 모델 3.0의 적용에 따라 기존의 파이프 라인당 24비트의 컬러 채널을 갖는 방식에서 업그레이드된 32비트의 컬러 채널을 가지며 이로인해 128비트 부동 소수점 형식의 데이터를 처리할 수 있게 되었다.


추가된 비트의 컬러 채널에 대해 현재로서는 24비트의 컬러채널 만으로도 처리하는데 문제가 없었지만 앞으로 많이 다루게 됨직한 무수히 반복되는 복잡한 쉐이더 처리와 같은 상황에서 아주작은 비트의 정밀도 문제로도 반복되는 동안 문제가 커질 수 있기 때문에 이러한 분야의 작업 처리에서 유용한 기술이 될 것으로 보여진다.

2005년 12월 11일 일요일

ATi X1K 계열의 새로운 도약 - 메모리 제어 -

 VGA시장에 최초 90nm 공정의 도입과 함께 X1K 계열의 새로운 기술들은 현제 시장의 추세인 고해상도 고화질 영상 출력물의 요구, 많은 지적을 받았던 쉐이더 모델3.0의 지원(HDR) 그리고 SLI와 같은 GPU의 병렬처리의 지원등의 요구를 만족시키기 위한 기술들을 가지고 출시 되었으며 새로 도입된 기술들 중 우선 메모리 제어부분을 살펴보도록 하자.

X1K계열의 메모리 컨트롤러


링버스 메모리 컨트롤러


ATi는 좀더 유연하고 효율적인 메모리 컨트롤러의 개발을위한 노력에 대한 결과로 링버스 메모리 컨트롤러를 도입하게 되었으며 기존의 기술과 어떤점이 다른지 알아보도록 하자.

기존의 ATi의 기존의 메모리 컨트롤러의 동작 원리는 다음과 같다.


  1. 메모리 클라이언트가 메모리 컨트롤러에 읽기신호를 보냄.
  2. 컨트롤러는 요구 신호의 순서에 따라 정확한 위치의 DRAM을 찾아 메모리 디바이스로 요청신호를 보냄.
  3. 메모리 디바이스는 요청된 데이터를 메모리 컨트롤러로 보냄.
  4. 메모리 컨트롤러로 보내진 데이터를 클라이언트로 보냄.


이와 같은 기존의 방식은 컨트롤러를 중심으로 PCB상에 많은 선들이 밀집되고 경로 설정에 어려움이 있어 512비트의 메모리 인터페이스와 같이 대역이 넓어진 환경을 구현하는데에 있어 매우 비효율적이다.

이런 문제를 해결하기 위해 분산 센터 방식의 링버스 구조의 컨트롤러를 도입하게 되었는데 구조는 다음과 같다.


(링버스 아키텍쳐 다이어그램.)


링버스의 동작 원리는 다음과 같다.


  1. 메모리 클라이언트가 메모리 컨트롤러에 읽기신호를 보냄.
  2. 컨트롤러는 요구 신호의 순서에 따라 정확한 위치의 DRAM을 찾아 메모리 디바이스로 요청신호를 보냄.
  3. 요청된 데이터가 위치한 메모리 디바이스는 데이터를 요청한 클라이언트와 가장 가까운 링스탑으로 요청된 데이터를 링버스에 실어보냄.
  4. 클라이언트는 요청했던 데이터를 링스탑을 통해서 받음.


 이와 같은 방식은 기존의 모든 DRAM을 메모리 컨트롤러와 직접 연결했던 방식과는 달리 링버스를 통해서 연결하는 방식이며 데이터의 이동또한 링버스 상에서 일어나며 링버스는 칩의 최외곽에 위치하여 모든 데이터의 이동 경로상의 문제를 칩의 외곽으로 전담 시켰으며 그로인해 GPU에 간섭을 주지 않는 넓은 대역과 빠른 속도를 제공하게 된다.


X1800의 경우 서로 상반되는 방향으로 동작하며 4개의 링스탑을 갖는 두 개의 256비트 버스로 구성(8채널)되어 512비트의 대역(듀얼 링버스)을 제공하며 X1600의 경우 이것의 절반인 256비트 그리고 X1300의 경우 Pro의 경우 256비트의 대역을 제공하 고 하위 카드는 그 절반 수준의 대역을 제공한다. 또한 X1600과 X1300의 경우 X1800의 절반인 2개의 링스탑(4채널)을 갖는다.


메모리 인터페이스


X1800 의 경우 링버스는 서로 상반된 방향의 듀얼채널 구성으로 512비트의 대역을 제공하며 이중 하나의 링버스는 256비트의 대역을 갖는다. 이는 기존의 하이엔드 카드들이 제공하는 256비트의 대역과 같지만 이를 구성하는데 있어 조금 다른 방법을 사용하고 있다. 기본의 256비트의 버스는 4개의 64비트 채널로 구성되어 있었지만 새로운 버스는 8개의 32비트 채널로 구성되어 있다. 이로 인해 얻어지는 이득은 기존의 버스는 32비트의 데이터가 요구되면 64비트의 대역을 갖는 1개의 채널을 점유해야하기 때문에 나머지 32비트의 공간은 낭비되는 현상이 있었지만 8개의 32비트의 채널로 구성된 새로운 인터페이스는 이런 상황에서 32비트 채널 하나만 할당하고도 32비트 채널이 하나더 남는 이점이 생겨 메모리 공간 낭비를 줄여주게 된다.


이로인해 X1600의 경우 4개의 32비트 채널로 구성되어 있으며 X1300의 경우 4개, 2개, 1개의 채널을 갖는 제품이 존재하며 그밖에 더욱 향상된 HyperMemory 2 기술이 적용된 제품또한 선보일 예정이다.


(기존의 메모리 채널 구성과의 비교도.)


내부 지연 시간을 없애다


 ATi는 메모리의 효율을 높이기위해 메모리 내부 지연시간을 최대한 줄여야 한다는 결론하에 새로운 방식의 캐쉬 운용 및 작업중재기의 도입을 이문제의 해결책으로 내놓게되었다 .


 먼저 캐쉬운용에 있어서 기존의 ATi 그래픽카드의 캐쉬는 직접사상캐쉬(Direct mapped cache)방식을 사용하여왔다. 이방식은 그래픽 메모리에 미리 정의된 블록상에 매핑된 데이터의 묶음을 그대로 이용해야 하는 방식이다. 이러한 방식은 정의된 데이터 묶음을 그대로 사용해야 함으로 인해 지연시간의 발생과 캐쉬 적중률 하락 그리고 메모리 대역의 낭비와 같은 문제가 있었다.


 이에 대안으로 X1K계열의 카드에서는 텍스쳐, 색상, 깊이 그리고 스텐실 버퍼에 완전연관사상캐쉬(Fully associative cache)방식을 사용하게 되었는데 이방식은 캐쉬의 어떤 라인이라도 외부 메모리의 빈공간이면 어느곳에나 매핑이 가능하다는 장점이 있어서 캐쉬의 동작 지연시간을 줄이고 적중률을 높일 수 있다.


(직접사상캐쉬와 완전연관사상캐쉬의 비교도.)


이와 함께 좀더 지능적이며 프로그래밍 가능한 메모리 우선순위 중재기 로직이 도입되었는데  이는 메모리의 읽기/쓰기와 관련한 모든 작업의 우선순위를 퍼포먼스 향상을 위해 조절해주는 역할을 한다.


 중재기 로직의 기본 동작 원리는 클라이언트의 데이터 소모량과 지연정도에 따라 좀더 높은 요구도를 갖는 클라이언트에 높은 우선순위를 주어 처리하는 방식인데 이방식엔 두가지 중요한 요소가 있으며 다음과 같다. 먼저 클라이언트의 중요도는 어플리케이션을 기반으로 프로그래밍 되어지며 그와함께 메모리의 효율성을 체크하여 가장 최적의 처리를 하게 되는데 이또한 어플리케이션을 기반으로 처리하게 되며 이 두가지 상태를 체크하는 방식은 추후 드라이버의 업데이트를 통해 지속적으로 개선될 수 있는 사항이며 특별한 어플리케이션 을 위해 Catalyst A.I를 통한 트윅 또한 가능하게 된다.


(A.I. 성능향상의 열쇠?)


이러한 프로그래밍 가능한 중재기를 도입은 메모리 효율을 극대화 시킬 수  있게 도움을 주었을 뿐만 아니라 쉐이더 처리유닛의 성능 향상에도 기여하고 있다.


(메모리 중재기 동작 다이어그램.)


압축기술의 업그레이드


ATi는 기존의 압축 기술인 3Dc를 한단계 업그레이드한 3Dc+를 X1K계열의 제품에 도입하여 기존의 두 개의 8비트 정수 컴포넌트로 구성된 노멀맵과 텍스쳐의 4:1압축을 지원 했던것에 대비 단일 8비트 정수 컴포넌트에대해 2:1압축의 지원이 가능하게 되었다. 또한 Hyper Z의 개선으로 기존의 Radeon 제품보다 약50%더 많은 보 이지 않는 영역을 제거할 수 있게 되었으며 Z/스텐실 버퍼의 압축을 최대 8:1까지 지원하여 고화질3D 영상과 안티알리아싱의 사 용 그리고 비등방성 필터링 사용시 대역 사용에 있어 좀더 효율적인 환경을 제공 하게 되었다.

2005년 12월 9일 금요일

ATi Catalyst Suite 5.12 Released ~*


> Catalyst™ 5.12는 다음을 포함합니다.:

    * Radeon® display driver 8.201
    * Multimedia Center™ 9.08
    * HydraVision™ 3.25.0006
    * HydraVision™ Basic Edition 3.25.9006
    * Remote Wonder 3.02
    * WDM Driver Install Bundle
    * Southbridge/IXP Driver
    * Catalyst® Control Center Version 5.12

! CCC를 설치하기 위해서는 반드시 닷넷프레임웍스 1.1이 설치되어 있어야 합니다.

! Remote Wonder™ 3.02 소프트웨어는 Remote Wonder™ 와 Remote Wonder™ II를 지원합니다. Remote Wonder™ Plus 사용자는 제품과 동봉된 드라이버를 사용 하시기 바랍니다.

* ATi WDM 드라이버 설치본에는 ATi WDM 드라이버 8.20과 4.07을 모두 포함하고 있으며 설치 프로그램은 ATI All-in-Wonder®또는 ATI VIVO™ 제품을 자동 감지하고 시스템에 맞는 ATi WDM 컴포넌트를 자동 선택 설치합니다.

WDM 8.20 이 설치되는 제품들:

    *  All-in-Wonder® X1800 Series
    *  All-in-Wonder® X800 Series
    *  All-in-Wonder® X600 Series
    *  All-in-Wonder® 9800 Series
    *  All-in-Wonder® 9700 Series
    *  All-in-Wonder® 9600 Series

WDM 4.07(6246)이 설치되는 ATi 제품들:
? Radeon® 9200 계열 또는 하위 All-in-Wonder® 제품들.
? ATI VIVO™ 제품들.

> Catalyst™ 는 다음의 ATi 데스크탑 제품을 지원합니다:

    * Radeon® X1800 series
    * Radeon® X1300 series
    * Radeon® X850 series
    * Radeon® X800 series
    * Radeon® X700 series
    * Radeon® X600 series
    * Radeon® X550 series
    * Radeon® X300 series
    * Radeon® 9X00 series
    * Radeon® 8500 series
    * Radeon® 7X00 series

> Catalyst™는 다음의 ATi 칩셋 제품을 지원합니다:

    * Radeon® Xpress 200 series
    * Radeon® 9000 IGP
    * Radeon® 9100 IGP
    * Radeon® 9100 IGP Pro
    * IXP 300

> Catalyst™ 5.12는 다음의 FireMV™ 제품들의 2D드라이버를 지원 합니다:

    * FireMV™ 2400
    * FireMV™ 2200 PCIe
    * FireMV™ 2200

> 최신 버젼의 Catalyst™소프트웨어는 다음의 MS윈도우즈 플렛폼을 지원합니다:

    * Windows XP
    * Windows XP Media Center Edition (graphics driver support only)
    * Windows 2000

> 새로운 기능들

Catalyst® 5.12는 CPU 의존적인 상황에서 듀얼코어 지원을 제공합니다. 이 기능으로 인해 DX9을 지원하는 그래픽 아답터가 설치된 Windows XP 그리고 Windows XP Professional x64 Edition 운영체제에서 향상된 퍼포먼스를 제공 합니다.

퍼포먼스 향상

Catalyst 5.12는 듀얼코어 또는 하이퍼쓰레딩 CPU와 함께 설치된 ATi 제품의 경우 다음과 같이 다양한 CPU의존적인 퍼포먼스의 향상이 있습니다 :

    * 3DMark05 에서 5.7%의 성능 향상
    * 3DMark03 에서 3.3%의 성능 향상
    * 3DMark2001 SE 에서 최대 10%의 성능 향상
    * Aquamark 3 에서 최대 16%의 성능 향상
    * Comanche 4 에서 20%의 성능 향상
    * Far Cry 에서 특정 제품 구성에서 25%의 성능 향상
    * Half-Life 2 에서 8%의 성능 향상
    * Splinter Cell 에서 확실한 8%의 성능 향상
    * Tomb Raider Angel of Darkness 의 동작이 10% 빨라짐
    * Unreal Tournament 2004 에서 10%의 프레임율 상승

* 그밖의 개선된 사항과 밝혀진 문제점은 원문을 참고 하시기 바랍니다

다운로드 : ATi.com의 메인페이지의 드라이버 & 소프트웨어 페이지를 참고 하시기 바랍니다.

Catalyst™ CREW Driver Feedback : https://support.ati.com/ics/support/default.asp?deptID=894&task=knowledge&questionID=737-1713

출처 : https://a248.e.akamai.net/f/674/9206/0/www2.ati.com/drivers/Catalyst_512_release_notes.html

2005년 12월 7일 수요일

ATi CrossFire


 소비자는 끊임없이 좀더 빠른 처리가 가능하고 저렴한 VGA솔루션을 갖길 원하고 VGA제조사 역시 이에 부응하기 위해 끊임 없이 노력을 하고 있지만 고성능의 VGA칩의 제조에는 트렌지스터의 집적도의 증가에 따라 수율 문제와 제조 비용의 증가라는 문제가 버티고 있으니 이에 따른 대안으로 Nvidia사 에서는 SLI(Scalable Link Interface)라 불리는 GPU의 병렬 처리 기술을 대안으로 내 놓았고 이에 뒤질세라 ATi또한 크로스 파이어라는 기술을 선보이게 되었다.


과거 ATi는 MAXX라는 기술을 이용하여 Rage Fury Maxx 제품을 선보였으나 당시 기술의 한계에 부딛혀 드라이버의 제공이 중단되고 많은 사람들의 기억에 좋지않은 이미지를 심어 주었었지만 2001년 ATi는 Evans & Sutherland 라는 회사와 협력하에 Radeon 9700과 9800칩을 사용한 멀티 GPU 워크스테이션 제품을 생산하였고 여기서 좋은 경험을 쌓은후 우리 앞에 크로스 파이어를 믿을수 있는 기술로 선보이게 되었다.



크로스 파이어가 동작하기 위해선 다음과 같은 조건을 만족해야 한다.


  • 컴포지팅 엔진이 장착된 크로스 파이어 에디션의 Radeon 카드가 마스터 카드로 필요.
  • 크로스 파이어를 지원하는 PCI-Express 버스를 갖는 슬레이브 Radeon 카드가 필요.
  • 크로스 파이어를 지원하는 듀얼 PCI-Express 버스 슬롯을 갖는 메인보드가 필요.
  • 크로스 파이어 기능을 지원하는 Catalyst 드라이버가 필요.

(크로스 파이어 동작 다이어그램, 이미지를 클릭하시면 확대된 이미지를 보실 수 있습니다.)


크로스 파이어 시스템 상에서 각각의 GPU는 메인보드의 노스브릿지를 통해서 연결이 되는데 이때 각각의 GPU는 시스템 메모리의 일부를 자신들의 작업을 처리하기 위해 점유하게 되고 일부 영역은 두 GPU간 동기 신호 처리와 텍스쳐 처리 그리고 렌더링을 위한 임시 데이터등을 저장하여 공유하게 되며 각각의 GPU에서 처리된 데이터는 마스터 카드의 컴포지팅 엔진에서 합쳐진후 우리의 디스플레이 장비로 뿌려지게 된다.


이러한 구성은 PCI-Express 버스의 양방향의 높은 대역 제공을 충분히 활용하여 향상된 퍼포먼스와 고화질의 3D이미지를 제공할 수 있게 되었다.


#극한의 성능


크로스 파이어의 성능향상을 위한 기술에는 다음의 세가지 기술이 있다.


[AFR 모드]

[Supertile 모드]

[Scissor 모드]


이와 같은 기술은 모두 드라이버의 Catalyst A.I.를 통해 사용되는 프로그램에 따라 자동으로 최적의 방법을 선택하게 된다.


Alternate Frame Rendering(AFR) 모드 :


각 각의 GPU가 서로 독립적으로 동작하며 각각 다른 완전한 한프레임을 처리하는 모드로 이 모드만이 각각의 GPU의 완전한 버텍스 처리 성능을 조합할 수 있는 모드이지만 현제 프레임이 앞의 프레임의 데이터에 의존적인 경우엔 매우 비 효율 적이다.


Supertile 모드 :


체스보드와 같은 패턴의 작은 타일(32x32픽셀)들을 각각의 GPU에서 처리하여 조합하여 출력해주는 방식으로 대부분의 3D어플리케이션에 효율적인 방법이지만 몇몇 상황에선 그다지 좋은 성능을 내지 못하는 경우도 있다.


Scissor 모드 :


수 평 또는 수직으로 나눈 영역을 각각의 GPU에서 처리하는 방식으로 영역의 크기는 절반 또는 특정 비율로 나뉠수 있고 이에 대한 처리는 어플리케이션에 따라 자동으로 설정되게 되며 일반적으로 Scissor 모드는 Supertile모드보다 효율이 떨어지지만 특정 상황에선 더 효율적인 경우도 있다.


#극한의 이미지 퀄리티


Super AA모드 :


 일반적으로 3D 렌더링된 이미지의 계단현상을 제거하기위해 안티 알리아싱 기법을 주로 사용하게 되는데 ATi의 Radeon GPU는 2,4 또는 6개의 픽셀상의 프로그래밍 가능한 위치의 샘플과 감마 보정 샘플 블랜딩 기법을 통해 폴리곤의 각진 부분을 부드럽게 처리 하는 SmoothVision HD 방식을 사용 하였다.


이에 향상된 크로스 파이어 환경에선 멀티 GPU파워를 활용해 동일 프레임 상의 각각 다른 위치의 샘플을 GPU에 할당한 8x, 12x의 슈퍼 안티 알리아싱 기법을 사용해 기존의 멀티 샘플 안티알리아싱 기법에서 제거할 수 없던 부분의 제거가 가능해 짐에 따라 좀더 향상된 이미지를 얻을 수 있게 되었다.


(Super AA모드의 동작 다이어그램, 이미지를 클릭하면 확대된 이미지를 보실 수 있습니다.)


ATi는 크로스 파이어 시스템의 안정적이고 만족스런 동작을 위해 꾸준히 Catalyst 드라이버를 제공할 것이며 단일 시스템 상의 그래픽 처리능력 향상을 위한 업그레이드를 고려할 때 분명 매력적인 솔루션이 되어줄 것 이다.

p.s. 지금은 크로스파이어 구성방식이 네이티브 크로스파이어로 바뀌었으며 외부 동글은 사라지고 내부 브릿지, 칩셋, 드라이버의 3요소로 동작합니다.

2005년 12월 3일 토요일

ATi AVIVO


소비자의 비디오와 디스플레이의 고해상도 출력물의 욕구에 따라 홈씨어터 시장은 매년 증가하는 추세이고 이에따라 HDTV의 보급도 증가 하고 있으며 최근 블루 레이와 HD-DVD규격의 발표도 모두 이러한 욕구를 만족 시키기 위해서 개발 된 것이다.


이러한 경향에 맞춰 "비디오와 디스플레이에서 완벽을 추구하다." 라는 문구로 시작하는 Avivo는 처음 소개 되었을 때 개인적으로 꽤 흥미가 생기는 기술 이었으며 Avivo는 다음과 같은 몇가지 사항을 요점으로 해서 태어나게 되었다.


  • 미디어 PC : 앞으로는 TV튜너가 달린 PC가 거실에 위치하게 될 것이며 TV와 PVR(Personal video recoder)의 소비자 또한 PC사용자가 주류를 이루게 될 것이다.
  • 디지털 TV의 대중화 : 앞으로는 디지털 신호를 수신하여 출력하는 것도 미디어 PC사용에 일반화 될 것이다.
  • HD-디스크 재생 : 블루레이와 HD-DVD기술의 도입에 따라 Avivo는 PC에서 이를 지원하는 향상된 디코딩 환경을 제공할 것이다.
  • 디지털 사진기술 그리고 디지털 이미징 : 디지털 이미징 기술이 사람들의 직업 또는 취미의 일부로 자리잡게 됨에따라 이에대한 지원 요구가 늘어나게 되었다.


이와 같은 사항들을 중점으로 해서 태어난 Avivo는 다음과 같은 비디오 파이프 라인을 정의하고 각 부분의 개선을 위한 다음과 같은 기술들이 적용 되었다.


(Video Pipeline)


#Avivo 캡쳐


Avivo 캡쳐의 기능은 Theater 550 Pro 기반의 TV캡쳐 제품이나 Theater T3xx 그리고 디지털 티비 시장을 타겟으로한 디지털 복조기인 Nxtwave제품 그밖에 ATi의 PC 제품인 HDTV원더 또는 Avivo 호환 캡쳐 기능을 갖는 제품에서 제공된다.


아날로그 퀄리티 향상을 위한 기술 :


자동 이득 컨트롤


아날로그 영상의 캡쳐에 있어서 입력되는 신호의 세기를 감지하여 신호가 약할 경우 이를 동적으로 증폭시키는 기능을 제공하며 필요한 경우에 색상의 명암을 적절히 조절해준다.


(Avivo 자동 이득 컨트롤 적용(좌) 미적용(우))


12비트 Analog to digital converters(ADCs, 아날로그-디지털 변환기)


아날로그 신호를 디지털 신호로 변환 할때 부적절한 작업으로인한 신호의 손실이나 왜곡의 발생을 피하기 위해 기존의 9,10 비트의 ADC보다 업그레이드 된 12비트의 ADC를 제공하여 신호의 왜곡을 최소화하고 좀더 나은 비디오 캡쳐를 지원 한다.



3D Comb 필터링


Comb 필터링은 비디오로 들어오는 색상과 밝기 신호를 분리하여 처리하는 전처리 기술이며 단순한 Comb 필터링 기술은 단일 이미지에 대한 신호만을 분리하여 처리하지만(일반적으로 2D Comb라고 부름)  이보다 향상된 ATi의 3D Comb 필터링은 기존의 요소에 시간의 변화에 따른 이미지의 변화의 요소가 추가되어 좀더 향상된 화질을 제공하게된다.


(Avivo 3D Comb 필터링(좌) 일반적인 2D Comb 필터링(우))


하드웨어 노이즈 제거


비디오에서 노이즈는 일반적으로 불필요하게 추가된 형태의 이미지를 말하며 이로인해 영상이 왜곡되고 압축시 파일 사이즈가 커지는 문제를 야기하게 되는데 이를 해결하기 위해 Avivo의 캡쳐/엔코더 기술은 하드웨어적으로 이러한 노이즈를 제거하여 이미지를 깨끗하게 하고 압축률을 향상 시켜준다.


디지털 캡쳐 - 다경로 취소기:


ATi 의 Avivo가 적용된 ATi의 디지털 복조기를 공중파 디지털 TV신호의 캡쳐장비에 사용하면 환경적인 영향(산, 언덕, 빌딩 과같은)으로 인한 에코와 잡음을 제거하고 필요로 하는 신호만을 수신할 수 있게하여 좀더 향상된 화질을 제공하게 된다.


#Avivo 인코드


하드웨어 MPEG2 압축


ATi의 AVivo 기술이 적용된 PC의 튜너-인코더 제품은 하드웨어 MPEG-2 압축을 지원하여 전보다 적은 CPU의 사용량으로 작업을 할 수 있도록 도와줄 것이다.


하드웨어 비디오 압축과 변환


압 축과 인코딩을 전담할 수 있는 Avivo가 적용된 티비튜너와 복조기에 덧붙여 Avivo가 적용된 VPU와 그에 동반되는 소프트웨어를 함께 사용하면 비디오 시그널의 하드웨어 변환이 가능하게 된다(변환 작업은 원본의 비디오 포멧을 다른형태로 재 인코딩 하는것과 같다.). 최근 휴대용 기기(PDA, 멀티 미디어 휴대폰, 휴대용 게임기 등)의 사용자가 증가함에 따라 제한 된 용량의 기기에 좀더 작은 용량으로의 비디오 변환을 해야하는 필요성 또한 증가하였고 따라서 이와 같은 기능을 제공하는 것이 중요하게 되었다.


#Avivo 디코드


만족스러운 재생을 위한 하드웨어 비디오 디코더


ATi의 VPU는 비디오 디코딩을 전담하는 블록을 가지고 있으며 여러 비디오 코덱들에 대해 유연하고 최적화된 환경을 제공 하여 부드럽고 잡음이 적은 영상을 보여주며 이에 대비해 CPU의 사용율도 줄여준다.

ATi의 Avivo 제품은 MPEG-2, WMV9, 그리고 최근 블루 레이와 HD-DVD로 부각되고 있는 H.264의 디코딩과 관련한 모든 것을 지원한다.


#Avivo 후처리


벡터 적응형 디인터레이싱


인 터레이싱(비월주사) 기법은 비디오의 시작과 함께 존재하였는데 문제는 최근의 디스플레이 장비가 실제적으로 프로그레시브 스캔(순차주사) 방식을 사용하고 있다는 점 때문에 이의 변환 작업에 디인터레이싱 이라는 기법을 사용하고 있지만 이러한 처리에 비효율적인 기법을 사용할 경우 화면에 계단 현상이나 물결치는 듯한 현상이 나타나기도 한다.


Avivo가 적용된 ATi의 제품에서는 향상된 벡터 적응형 디인터레이싱을 지원하여 매우 작은 기울기의 대각선과 같은 부분도 깨끗하게 처리할 수 있게 되었으며 이러한 기법은 원본 데이터의 여러 벡터를 참조하여 부족한 부분을 매꿔서 더 많은 양의 데이터를 갖는 프로그레시브 타입의 이미지로 재구축하여 보여줌으로써 좀더 나은 이미지를 제공하게 된다.


향상된 스케일링 엔진


비디오와 이미지의 확대와 축소 그리고 해상도의 제한이 있는 디스플레이 장비로의 출력 등과 같은 작업시 원본 이미지의 디테일 유지와 계단 현상과 같은 왜곡을 줄이기 위해 Avivo에서는 pre 그리고 post 스케일링 엔진을 제공한다.


pre 스케일링 엔진의 경우 어플리케이션(윈도우 상의 미디어 플레이어와 같은)에 의해 원본해상도에서 다른 해상도로의 변경 요청이 있는경우 요구되는 작업을 처리하며 post 스케일링 엔진의 경우 디스플레이 순응형 작업을 수행하는데 이에 관한 사항은 Avivo Display 부분에서 다루도록 하겠다.


#Avivo 디스플레이


듀얼 10비트로 연결된 디스플레이 처리기


Avivo의 디스플레이 처리기는 디스플레이 파이프라인과 디스플레이 장비들과 최상의 연결성을 제공하는 출력 인터페이스 부분으로 이루어져 있다.


(Avivo 디스플레이 엔진의 다이어그램.)


업계 최초의 10비트 컬러로 동작하는 파이프라인은 다음과 같은 작업을 수행 한다.


  • 고품질 감마 보정 : 기존의 8비트 깊이의 색상부터 16비트의 부동소수점 타입의 컬러까지 감마보정 작업을 수행 할 수 있다.
  • 색생 보정 : 출력되는 모든 단일 픽셀에 대해 완전한 컬러 보정변환 작업이 수행되며 컬러 스페이스 변환시에도 적용 되게된다(RGB to YPrPb 또는 vice-versa로의 변환 같은).
  • 유 연한 스케일링 : 원본 소스의 해상도의 증가, 감소 작업에서 운용되는 디스플레이 장비에 가장 적합한 방법으로 유연하게 스케일링 작업을 수행하며 또한 10x6 탭(각각의 최종 출력 픽셀에대해 6라인당 10개의 수평 샘플을 갖는)의 고화질 필터링 또한 지원하고있다.
  • 디더링 : 내부 처리는 컬러당 10비트의 처리를 하지만 실질적으로 현재 사용되는 디스플레이 장비는 일반적인 데스크탑의 경우 컬러당 8비트 노트북과 같은 장비는 6비트의 컬러 출력을 지원하기 때문에 컬러 비트를 줄여야 하지만 디더링 엔진에서 잉여 비트를 이용하여 10비트 출력에 가까운 화질의 영상을 디스플레이 해주게된다 .


파이프 라인상의 두 디스플레이는 서로 동일한 기능을 제공하며 디스플레이 아답터에 2개의 장비로 잡히는 것도 바로 이런 연유에서이며 Avivo는 기존의 방식보다 향상된 기능을 제공하고있다.


극한의 연결성


좋은 기능을 가지고 있으면서 이를 사용할 수 있는 분야가 적다면 그야말로 낭패가 아닐수 없다. 이를 위해 Avivo는 어떠한 디스플레이 장비에도 PC가 연결 될 수 있는 환경을 제공하며 다음과 같은 연결성을 제공 한다.


  • Xilleon 티비 인코더와 같은 제품을 사용하여 디지털 티비아웃이 가능하다(Xilleon은 ATi의 디지털 티비와 관련한 생산제품이다.).
  • VGA DAC은 파이프라인을 통해 10비트의 데이터를 처리한후 출력으로 바로 보낼수 있기 때문에 만약 컬러당 10비트의 데이터를 출력 할 수있는 CRT장비가 생산되게 된다면 이를 바로 이용할 수 있다.
  • 디지털 티비와의 연결에 HDMI를 지원하여 비디오 이미지와 오디오의 단일 연결이 가능하다.
  • HDCP호환 기능을 제공하여 보호된 컨텐츠를 볼 수 있다.
  • 두 개의 듀얼링크 DVI포트는 LCD상에 1920x1200과 같은 고해상도 출력을 지원 한다.
  • 컬러당 10비트 또는 16비트의깊이를 갖는 특별한 디스플레이 장비또한 지원 한다.


Avivo는 분명 디스플레이 부분에 있어 매력적인 기술이며 개인적으로 앞으로의 지원이 매우 기대되는 부분이다.