Agora
Media
Libraria Byblos



AgoraNews  





PC Magazine Ro  




NET Report   




Ginfo   




agora ON line   





PC Concrete   





Liste de discuții   




Cartea de oaspeți   




Mesaje   





Agora   








Clic aici
PC Report - ultimul numar aparut


Tendințe - PC Magazine Romania, Martie 2004

Operațiunea Prescott

Bogdan Kerekes

Intel nu a purtat până acum un război ușor cu AMD. Lupta a fost crâncenă însă Intel a reușit să stabilizeze frontul cu scalabilitatea platformei Pentium 4. Într-un scenariu favorabil ei, compania ar fi avut suficient timp pentru pregătirea unei noi ofensive bazate pe noul proces de fabricație de 90nm până când inamicul să se dezmeticească. Însă zvonurile din ultima perioadă au indicat faptul că 90nm nu pot fi atinși fără o serie de probleme, printre ele numărându-se temperaturile ridicate de operare și consumul ridicat de energie. Rezultatul poate fi văzut la lansare. Inițial, Intel avea de gând să lanseze noul procesor în cantități suficiente la frecvențe de 3,4 GHz. Însă se pare că rata de succes la 3,4 GHz a fost destul de scăzută, putându-se vorbi mai mult de o lansare "pe hârtie" la această frecvență.

Intel recunoaște că disponibilitatea variantei 3,4 GHz va fi scăzută o perioadă de timp, distribuitorii având un acces mai facil la variantele 3,2 GHz și inferioare.

Pentru a masca mișcările deloc ample de trupe, Intel mai aruncă pe câmpul de luptă și câteva fumigene: o pereche de noi procesoare Pentium 4 construite pe baza tehnologiei precedente, Northwood. Unul dintre ele este un procesor Northwood "clasic" cu 512 kB de cache de nivel 2. Celălalt va fi o variantă îmbunătățită a primului, ridicat astfel la rangul de Pentium 4 Extreme Edition (botezat "Emergency Edition", cel mai probabil de către inamici), cu un cache de nivel 2 de 512 kB și cu 2 MB de cache nivel 3. Ambele vor lucra la 3,4 GHz.

Fig. 1 - Caracteristici de baza ale procesoarelor.

Microarhitectura Prescott

Atunci când Intel a trecut la procesul de 130 nm cu nucleul Northwood, proiectanții au mai adăugat 256 KB de memorie cache de nivel 2 și au dezlănțuit o facilitate ce era prezentă, însă ascunsă, încă de la Willamette: posibilitatea de a executa simultan mai multe activități, pe care Intel a botezat-o Hyper-Threading. Inițial, această armă a fost dezactivată și în Northwood, însă a fost pe deplin desfășurată în fața publicului atunci când a fost atinsă frecvența de 3,06 GHz.

Odată cu trecerea la 90 nm, Intel a avut din nou ocazia de a îmbunătăți arhitectura. Prescott are un număr de îmbunătățiri, unele fiind simple valorificări ale unui proces de fabricație superior, altele fiind modificări de substanță ale arhitecturii interne. Cea mai evidentă schimbare, adusă de dimensiunea redusă a pastilei procesorului fabricat la 90 nm, este memoria cache adițională. Atât cea de nivel 1 și 2 a fost dublată, ajungând la 16 KB respectiv 1MB pentru cea de nivel 2, unificată pentru date și instrucțiuni. Astfel, noua tehnologie permite construirea unui procesor cu dublul cache-ului din Northwood și totodată cu o dimensiune redusă. Intel a mai făcut încă o manevră, promovând agresiv wafere de 300 mm (discurile de siliciu din care sunt realizate procesoarele). Rezultatul este reducerea semnificativă a costului per procesor fabricat, dintr-un wafer fiind realizate astfel mai multe procesoare. Cu siguranță, costul noilor tehnologii de fabricație trebuie amortizat, însă pe termen lung costurile sunt reduse și nu ar fi exclus ca la un moment dat să avem pe piață procesoare mai ieftine.

Benzi de asamblare, jocul de-a predicția și alte modificări

Filosofia ce a stat la baza procesorului Pentium 4 a fost scalarea performanței prin creșterea frecvenței de operare. O cale de a atinge frecvențe mai mari este creșterea numărului de etape de pe pipeline, timpul de propagare între etape fiind redus. Însă o arhitectură cu o bandă lungă de asamblare trebuie să aibă o foarte bună cunoaștere a instrucțiunilor ce urmează să intre la prelucrare în viitorul apropiat.

Abilitatea de a prezice momentul când codul se va ramifica și deci a cunoaște ce cod va intra la prelucrare în procesor este cunoscută drept "predicția salturilor". O arhitectură cu benzi de asamblare prelungi are nevoie de o unitate de predicție a salturilor aproape infailibilă. Dacă la prelucrare intră instrucțiuni de pe ramura incorectă, banda de asamblare va trebui oprită, golită de conținut și reîncărcată cu instrucțiunile corecte.

Aritectura Prescott a mai primit 8 KB cache de nivel 1, pentru un total de 16 KB, ce este acum de tip asociativ pe 8 căi. Noul cache de 1 MB de nivel 2 a rămas tot de tip asociativ pe 8 căi.

A fost adăugată o nouă unitate de înmulțire pentru întregi. Anterior, multiplicatorul în virgulă mobilă era folosit și pentru întregi, însă astfel era crescută latența prin mutarea operanzilor în unitate și apoi preluarea rezultatului ca întreg. Acum și instrucțiunile de deplasare laterală și rotire pot fi executate mai rapid și asta datorită unui nou bloc logic inclus în una dintre cele două unități rapide aritmetico-logice. În arhitecturile anterioare, astfel de operații erau complexe și mari consumatoare de ciclu procesor.

Multe dintre îmbunătățiri pot părea absolut minore din punct de vedere al eficienței. Însă toate au fost făcute având Hyper-Threading-ul dreot țintă. De fapt, unele dintre modificările arhitecturale nu au nimic de a face cu rularea unui singur thread, însă își dovedesc eficiența în condiții multi-threading.

Instrucțiuni SSE3

Prescott a primit și un număr de 13 instrucțiuni SSE printre care:

  • o instrucțiune pentru accelerarea conversiei de la virgulă mobilă la întreg
  • 5 instrucțiuni pentru îmbunătățirea eficienței încărcării, mutării și duplicării datelor SIMD, utile în algoritmi numerici complecși
  • o instrucțiune pentru evitarea afectării cache-ului atunci când se încarcă date, utilă în anumite aplicații de compresie video
  • 4 instrucțiuni pentru facilitarea manipulării structurilor masive de date. Utile în grafica 3D mai ales la manipularea vertecșilor.
  • două instrucțiuni pentru facilitarea sincronizării threadurilor, cu îmbunătățiri ale performanțelor Hyper-Threading

Asemeni adăugirilor anterioare la setul standard de instrucțiuni, beneficiile pot fi văzute doar în cazul recompilării aplicațiilor, iar în unele cazuri doar în cazul în care ele vor fi optimizate manual. Din moment ce Prescott a fost trimis partenerilor încă de acum câteva luni, așteptarea pentru o serie de aplicații cheie s-ar putea sa nu fie chiar așa îndelungată.

Ce urmează

Prescott nu își va putea arăta adevărata valoare în teste până când aplicațiile nu vor fi optimizate SSE3. Însă SSE3 nu va însemna salturi spectaculoase în toate aplicațiile. De exemplu, aplicațiile tip office nu vor avea cum să câștige performanță la acest capitol. Iar viteză crescută în jocuri nu se va putea vorbi până când bibliotecile DirectX și driverele nu vor fi optimizate pentru Prescott.

Adevărata putere a lui Prescott stă însă în Hyper-Threading, tehnologie ce va rămâne în atenția Intel. Testele au arătat că în majoritatea testelor, un Prescott de 3,2 GHz depășește un Northwood de 3,4 GHz. Dacă lucrați pe un desktop cu o mulțime de ferestre deschise și cu multe procese ce rulează în background, o situație deloc excepțională în zilele noastre, Prescott s-ar putea să fie exact ce vă doreați.

Performanța Prescott este de așteptat să crească destul de rapid odată cu ajungerea la cota 4 GHz către finalul anului. O linie mai lungă de asamblare va permite o scalare mai bună comparativ cu Northwood. Iar performanța multitasking este doar un alt as aflat în cărțile Intel. În curând vom vedea ca de obicei si procesoare Xeon bazate pe noul nucleu, cu mai mult cache și cu facilități multiprocesor.


PC Magazine Ro | CD ROM | Redactia | Abonamente | CautareArhive

Copyright © 1999-2004 Agora Media.

[email protected]

LG - LifeŽs Good

www.agora.ro

deltafri

www.agora.ro

www.agora.ro

www.agora.ro