ATI Radeon HD 2900 XT.pdf

(2879 KB) Pobierz
62894690 UNPDF
TECHNOLOGIE
ATI Radeon HD 2900 XT
Dobra klasa średni a
Wiosną pojawiły się nowe procesory graiczne ATI Radeon HD 2900XT. Obecnie już
kilkunastu producentów ma w ofercie karty graiczne korzystające z tego układu.
Rywalizują z najlepszymi kartami średniej klasy i bez trudu je pokonują.
Moim zdaniem
Sebastian Kręzel
Redaktor działu Hardware
Karty graiczne z układami ATI
Radeon HD 2900 XT (kodowa na-
zwa R600) oferują między innymi
irmy Asus, Gigabyte, MSI, HIS, Sap-
phire. Karty kosztują 1400–1550 zł.
Ich bezpośrednią konkurencją są
mocne karty ze średniej półki, ko-
rzystające z układu Nvidia GeForce
8800 GTS i wyposażone w 640 MB
pamięci.
Dla graczy karty z nowym ukła-
dem ATI są niezwykle atrakcyjną
propozycją. W większości przypad-
ków wypadają lepiej od porówny-
walnej cenowo karty z GeForce’em
8800 GTS. Co więcej, w niektórych
grach, np. UT2004 Assault, doga-
niają najszybsze karty z nowym
procesorem Nvidia GeForce 8800
Ultra (kosztujące ok. 3000 zł)! Są
to na razie sporadyczne sytuacje.
Dopiero przygotowywana kolejna
wersja układu ATI, o oznaczeniu
prawdopodobnie HD 2900 XTX,
będzie mogła na większym polu
rywalizować z układem GeForce
8800 Ultra. Nie wiadomo jednak,
kiedy się pojawi.
Wśród nowości wprowadzonych
w ATI Radeon HD 2900 XT do naj-
ważniejszych należą zuniikowane
jednostki cieniowania, obsługa bi-
bliotek graicznych DirectX10 oraz
ciekawy sposób zarządzania pracą
jednostek cieniujących oraz prze-
pływem danych.
64 jednostki cieniowania
ATI Radeon HD 2900 XT, podobnie
jak konkurencyjne GeForce’y, wyko-
rzystuje ujednolicone, uniwersalne
jednostki cieniowania (shadery). Jed-
nostki te, w zależności od wymogów
gry, mogą pełnić funkcję zarówno
vertex shaderów (procesorów operu-
jących na wierzchołkach), jak i pixel
shaderów (procesorów, od których
zależą działania na pikselach). Do
niedawna procesor graiczny zawie-
rał specjalizowane jednostki obu
rodzajów.
Układ ATI jest przystosowany do
obsługi bibliotek DirectX 10. Aby
jednak mógł sprostać wymogom sta-
wianym przez nowe efekty graicz-
ne, udostępniane przez te biblioteki,
musi mieć odpowiednio dużą moc
obliczeniową. Moc obliczeniowa
zależy zaś od liczby jednostek ob-
liczeniowych, które składają się na
shadery. ATI Radeon HD 2900 XT
ma 64 shadery, może więc jedno-
cześnie pracować nad maksymalnie
64 algorytmami cieniowania. Trzeba
dodać, że nazywanie tych małych
procesorów shaderami jest dużym
uproszczeniem. Można je bowiem
obarczyć innymi zadaniami, np. ob-
liczeniami związanymi z dźwiękiem
przestrzennym czy wzajemnymi i-
zycznymi oddziaływaniami różnych
obiektów na scenie w grze.
Przeglądając specyikację nowe-
go układu graicznego ATI, dowiesz
się, że zawiera on aż 320 jednostek
obliczeniowych! Pamiętaj jednak, że
owych 320 jednostek nie jest rów-
noważne z liczbą shaderów, jak
to mają w zwyczaju prezentować
sprzedawcy. Dopiero połączenie
ich w grupy (5 jednostek oblicze-
niowych + jedna jednostka skoków)
daje pojedynczy procesor cieniujący
– stąd w rzeczywistości HD 2900
XT ma 64 shadery. Dla jasności,
podawana w przypadku układów
konkurencyjnych liczba jednostek
obliczeniowych – 96 dla GeForce
8800 GTS czy 128 dla GeForce 8800
GTX – również nie oznacza liczby
shaderów. Dopiero połączone jed-
nostki obliczeniowe, pracujące nad
jednym efektem, tworzą pojedynczy
shader. Liczba shaderów jest zatem
dynamicznie modyikowana i zależ-
na od tego, ile elementarnych jed-
nostek obliczeniowych będzie brało
udział w obliczaniu poszczególnych
efektów graicznych. To jest jedna
Kolejne przesunięcia premiery naj-
nowszych procesorów graficznych
ATI rodziły wątpliwości, czy w ogóle
się pojawią. Watpliwości pogłębiło
przejęcie irmy ATI przez korporację
AMD. Wreszcie procesory oraz bazu-
jące na nich karty ukazały się i… za-
skoczyły zwłaszcza graczy. Dlaczego?
Dotychczas nowe procesory graiczne,
a właściwie bazujące na nich karty
graficzne, ukazywały się najpierw
w najmocniejszych odmianach. Nieste-
ty, nowa karta z układem AMD/ATI nie
była na tyle wydajna, aby rywalizować
z najszybszymi kartami bazującymi na
procesorach graicznych konkurenta,
czyli Nvidii. AMD/ATI ogłosiło zatem,
że jest to topowa karta, ale ze śred-
niego pułapu cenowego! Pierwszy raz
na rynku taka sytuacja miała miejsce.
Może to oznaczać, że chwilowo AMD/
ATI nie jest w stanie wyprodukować
układu, mogącego konkurować z su-
perwydajnymi układami z najwyższej
półki. Jednak nawet jeśli tak jest,
to na rynku układów średniej klasy
mocno popsuje szyki Nvidii.
Budowa shadera w ATI Radeon HD 2900 XT
Każdy z 64 shaderów układu ATI
Radeon HD 2900 XT jest specjali-
zowanym procesorem. W jego skład
wchodzi pięć prostych jednostek ob-
liczeniowych (łącznie jest ich 320),
z których jedna jest przystosowana
do wykonywania bardziej złożonych
działań matematycznych. Każdy
z shaderów jest uzbrojony w moduł
obsługi skoków między liniami kodu
programu.
z wielu różnic między konstrukcją
irm ATI i Nvidia.
Zarządzanie przepływem
danych
Do obsługi tak dużej liczby jedno-
stek w układzie ATI został dodany
osobny procesor (Ultra-Threaded
Dispatch Processor), który zarzą-
dza przydzielaniem zadań jed-
nostkom cieniującym i optymali-
zuje ten proces. Ciekawostką jest,
120
PC Format 10/2007
SOFTWARE
1 jednostki obliczeniowe: cztery wykonują ope-
racje mnożenia i dodawania, piąta – bardziej zło-
żone działania; 2 jednostka obsługująca skoki
(rozgałęzienia w programach); 3 rejestr roboczy
– przechowuje m.in. dane pobierane przez jednostki
obliczeniowe shadera
62894690.029.png 62894690.030.png 62894690.031.png 62894690.032.png 62894690.001.png 62894690.002.png 62894690.003.png 62894690.004.png 62894690.005.png
ATI Radeon HD 2900 XT
TECHNOLOGIE
że jednostki cieniujące nie muszą
wykonywać zadania od początku do
końca. Mogą zawieszać pracę nad
wykonywaniem zadania z różnych
przyczyn (np. oczekiwania na dane,
które będą dopiero wyliczane), ale
nie pozostają wtedy bezczynne. Pro-
cesor, który optymalizuje ich pracę,
kontroluje setki równoległych wąt-
ków, których jest znacznie więcej
niż shaderów. W razie przerwania
pracy nad jednym zadaniem sha-
der natychmiast otrzymuje inny wą-
tek do wykonania. Ten poprzednio
przerwany może dokończyć inny
shader w późniejszym terminie.
Dzięki takiemu rozwiązaniu żad-
na z jednostek nie „próżnuje” na-
wet przez chwilę, a procesor cały
czas pracuje z maksymalną mocą
obliczeniową.
Ważną modyfi kacją jest zasto-
sowanie 512-bitowej, wewnętrznej
pierścieniowej szyny pamięci, służą-
cej do komunikacji między układem
a pamięcią RAM karty grafi cznej.
Szyna pracuje w trybie full duplex,
zatem w jednym czasie może jed-
nocześnie odbierać i wysyłać dane.
Teoretycznie więc jej szerokość to
1024 bity. Rozwiązanie to zapewnia
płynne (bez opóźnień) przesyłanie
danych między procesorem grafi cz-
nym a pamięcią RAM karty, gdyż
dostęp do każdego shadera zapew-
nia indywidualne pasmo (patrz ram-
ka „Komunikacja układu ATI z pa-
mięcią RAM karty grafi cznej”).
Wydajno dzi
i w przyszło ci
Do porównania wydajności ukła-
dów Radeon HD 2900 XT i bezpo-
średniego konkurenta GeForce 8800
Komunikacja układu ATI z pamięcią RAM karty grafi cznej
W układzie ATI Radeon HD 2900 XT
zastosowano pierścieniową, 512-bitową
szynę pamięci, przez którą odbywa się
komunikacja między układem a pamięcią
RAM karty grafi cznej. Ciekawym rozwią-
zaniem jest wykorzystanie tzw. przystan-
ków. Dane z procesora grafi cznego przez
przystanek „wjeżdżają” na pierścieniową
magistralę, aby móc „zjechać” z magistrali
na tym samym lub innym przystanku
i znaleźć się w pamięci RAM karty grafi ki.
Z danego przystanku dane mogą bezpo-
średnio trafi ć tylko do części pamięci, za
którą dany przystanek odpowiada i z którą
komunikuje się dwiema 64-bitowymi
szynami. Rozwiązanie takie jest znacznie
efektywniejsze niż stosowany w dotychcza-
sowych układach grafi cznych krzyżowy
kontroler 119>07 pamięci.
1 512-bitowa pierścieniowa szyna
pamięci
2 przystanek pamięci
3 kości pamięci RAM karty graficznej
4 przystanek szyny PCI Express
5 interfejs wymiany danych
pomiędzy procesorem grafi cznym
a przystankiem pamięci
GTS nie wystarczy zestawienie ich
parametrów (liczby jednostek obli-
czeniowych i shaderów, częstotli-
wości zegarów i wielkości pamię-
ci). Przede wszystkim dlatego, że
układy te mają odmienne struktury.
Obecnie wydajność karty w grach
zależy w dużym stopniu od jako-
ści jej sterowników. Tymczasem
te do kart z procesorem Radeon
HD 2900 XT są jeszcze niedopra-
cowane. Drugim czynnikiem decy-
dującym o osiągach karty jest to,
w jakim stopniu dana gra jest przy-
stosowana do obsługi konkretne-
go procesora grafi cznego. W wielu
grach, także tych najnowszych, kar-
ty z procesorem ATI HD 2900 XT
zdecydowanie przewyższają karty
z GeForce 8800 GTS 640 MB. Są
jednak gry, w których konstrukcja
ATI wypada znacznie słabiej (np.
Far Cry z włączonym wygładza-
niem krawędzi).
Wyniki te nie są jednak jedno-
znaczne. Zarówno układy ATI, jak
i Nvidia zostały przygotowane z my-
ślą o grach wykorzystujących biblio-
teki grafi czne DirectX 10 119>08
. Ponieważ takich gier jest na razie
niewiele, układy te działają najwyżej
na „pół gwizdka”. Poza tym produ-
cenci gier – aby zapewnić ich zbyt
– przygotowują je tak, by dobrze
działały zarówno na komputerach
nowych, jak i nieco starszych. Nie
są więc optymalnie dostosowane do
współpracy z kartami, które obsłu-
gują DirectX 10. Minie sporo cza-
su, zanim powstaną gry, które będą
wykorzystywać w pełni możliwości
nowych kart. I wtedy dopiero bę-
dzie można rzetelnie oceniać ich
wydajność.
Oceń lub skomentuj na
www.pcformat.pl/ocena
REKLAMA
Programowalne jednostki w ATI Radeon HD 2900 XT
W układzie ATI w pracach nad przetwa-
rzaniem obrazu bierze udział znacznie
więcej programowalnych jednostek niż
do tej pory. Najważniejsze z nich to:
Jednostka wstępnego przetwarza-
nia (setup engine) – odpowiada za
wstępne przetworzenie i posortowanie
informacji o otrzymanej scenie z gry;
w układzie tym znajduje się też jed-
nostka tesselacji 118>06 , która na
podstawie zadanego algorytmu potrafi
z prostego obiektu uczynić obiekt o bar-
dzo złożonej siatce, a więc o większej
liczbie detali.
Wielowątkowy procesor przydziela-
nia zadań (Ultra-Threaded Dispatch
Processor) – kontroluje liczbę pobra-
nych zadań oraz dba o trwałe obcią-
żenie shaderów.
64 zunifi kowane jednostki cie-
niowania (shadery) – specjalizowane
procesory, od których zależy przetwa-
rzanie otrzymywanych informacji zgodnie
z zadanymi algorytmami.
Cztery jednostki teksturowania
– procesory wstępnie opracowujące
tekstury, które są przekazywane jed-
nostkom cieniującym; jeden procesor
tekstur przypisany jest do 16 shaderów
zgrupowanych w jeden blok.
Jednostki wykańczające – zanim
przeliczone informacje zostaną prze-
słane do pamięci karty graficznej,
układy wykańczające dodają jesz-
cze efekty mgły i przezroczystości;
ponadto zajmują się wygładzaniem
krawędzi sceny.
Pierścieniowa szyna pamięci –
512-bitowa szyna pamięci działająca
w trybie pełnego dupleksu (jednoczesny
odczyt i zapis danych).
62894690.006.png 62894690.007.png 62894690.008.png 62894690.009.png 62894690.010.png 62894690.011.png 62894690.012.png 62894690.013.png 62894690.014.png 62894690.015.png 62894690.016.png 62894690.017.png 62894690.018.png 62894690.019.png 62894690.020.png 62894690.021.png 62894690.022.png 62894690.023.png 62894690.024.png 62894690.025.png 62894690.026.png 62894690.027.png 62894690.028.png
Zgłoś jeśli naruszono regulamin