neprihlásený Štvrtok, 18. apríla 2024, dnes má meniny Valér
Nová technológia pre pripojenie akcelerátorov

Značky: Intel

DSL.sk, 22.3.2019


Spoločnosť Intel aktuálne informovala o vyvinutí novej technológie a štandardu CXL pre pripojenie výkonných hardvérových akcelerátorov vyžadujúcich aj vysoké rýchlosti komunikácie.

Technológiu CXL, Compute Express Link, vyvinul Intel a následne ju posúva konzorciu viacerých popredných IT spoločností, ktoré ju budú ďalej rozvíjať. Sú v ňom okrem Intelu aj HPE, Dell EMC, Cisco, Huawei, Microsoft, Google, Facebook a Alibaba.

Rozličné akcelerátory sú čoraz dôležitejším komponentom najmä serverových systémov, pričom v poslednom období sa nasadzujú okrem iného často pre akceleráciu metód umelej inteligencie a strojového učenia.

CXL je fyzicky založená na novej pripravovanej verzii rozhrania PCI Express 5.0. To v novej verzii zdvojnásobuje rýchlosť oproti ešte len prichádzajúcej PCI Express 4.0 a dokáže po jednej linke prenášať dáta rýchlosťou 3.9 GB/s a cez x16 slot rýchlosťou 63 GB/s.

Podstatnou vlastnosťou CXL je zabezpečenie tzv. pamäťovej koherencie, podľa popisu zrejme priamo samotnou technológiou. V prípade viacerých procesorov v jednom systéme pristupujúcich do pamäte, CPU a procesorov akcelerátorov, vzniká problém so zmenou dát v pamäti jedným procesorom ale nacachovaných starších hodnôt ostatnými. Systém má zabezpečenú pamäťovú koherenciu, ak má vyriešený tento problém a zabezpečené správne dáta pre všetky procesory.

CXL bude konkurovať zrejme najmä podobnej technológii CCIX, cache coherent interconnect for accelerators. Tá je tiež nadstavbou PCI Express fungujúcou na rýchlostiach PCI Express 4.0 so 16 GT/s prípadne ešte vyšších s 25 GT/s. Nvidia zase používa technológiu NVLink.

Špecifikácia prvej generácie CXL má byť dostupná v prvom polroku tohto roka a čo sa týka produktov, minimálne Intel avizuje podporu CXL vo svojich produktoch pre dátové centrá na rok 2021.


      Zdieľaj na Twitteri



Najnovšie články:

Pôsobivého dvojnohého robota Atlas nahradí úplne nová elektrická verzia
O2 spustilo predaj na diaľku. Namiesto eID sa fotí tvár a občiansky, nedá sa objednať eSIM ani predplatenka
Klon populárnej databázy Redis od Linux Foundation k dispozícii v prvej verzii
Helikoptéra na Marse bude zbierať dáta aj po strate komunikácie so Zemou
Vývoj pôsobivého dvojnohého robota prekvapivo končí
Spustená výrobca QLC flash pamäte s viac ako 200 vrstvami
Batérie vyhodené z vesmírnej ISS neočakávane nezhoreli a poškodili dom v USA
Sprístupnená beta verzia Ubuntu 24.04 LTS
Nový CPU Apple M4 majú dostať všetky Macy, s výnimkou najvyšších najneskôr do jari
Samsung sa v predaji smartfónov vrátil pred Apple


Diskusia:
                               
 

AMD nas dobieha vo vykone? To nic, vymyslime si novy proprieatarny standard
Odpovedať Známka: 1.0 Hodnotiť:
 

AMD niekoho dobieha?
Odpovedať Známka: -3.8 Hodnotiť:
 

Nie, už ho predbehol.
Odpovedať Známka: 6.3 Hodnotiť:
 

AMD nas predbieha vo vykone? To nic, vymyslime si novy proprieatarny standard
Odpovedať Známka: -5.0 Hodnotiť:
 

Holt, vymysliet proprieatarnu alternativu k neexistujucemu slobodnemu standardu je objektivne priekazne zapeklitejsie.
Odpovedať Známka: -2.9 Hodnotiť:
 

nove a rychlejsie
Odpovedať Známka: 3.3 Hodnotiť:
 

lepšie ako nové a krajšie.
Odpovedať Známka: 6.7 Hodnotiť:
 

hej intel , kolko je 2+2....5 hovori intel instantne...ale to nie je dobre...ale bolo to rychlo...hovori intel...
Odpovedať Známka: -2.5 Hodnotiť:
 

Treba zvazit cestu jedneho silneho jadra s jednym vlaknom a nie xy jadier, kazde s dvoma + vlaknami. Je to slepa vyvojova vetva, ku ktorej potom treba vymyslat riesenia uvedene v clanku. Jedno poriadne jadro, disk s uz implementovanou RAM a grafickou pamatou, zuvukovou kartou a ostatne nalezitosti. Desktop bude mat minimalnu velkost a poriadny vykon. Ostatne je slepa ulica.
Odpovedať Známka: -7.9 Hodnotiť:
 

Slepý si jedine ty. Dokonca už aj widle vedia pracovať s viacerými vláknami, akurát niektoré hry na starých enginoch s tým majú problém.
Odpovedať Známka: 6.7 Hodnotiť:
 

Problem je ze frekvenciu jedneho jadra CPU nejde zvysovat donekonecna naraza to na technicke limity. Takze tam kde nestaci single thread nastupuje paralerizacia. Mas pravdu v tom ze pre programatorov je omnoho komplikovanejsie pisat viac jadrove aplikacie a rozhodne zo 4jadroveho CPU nevymackas 4x vacsi vykon ako z 1neho jadra. Preto kodit multijadrove aplikacie nemozu ziadni php bastlici ale skutocni programatori, ktori vedia v imperativnych jazykoch pouzivat vlakna, alebo ovladaju nejaky funkcionalny jazyk. Funkcionalne jazyky (nie vsetky bohuzial) umoznuju implicitny paralelizmus a fakt sa v nich tieto veci kodia dost dobre, problem je ze sa to hodi len na niektore typy uloh: ak mas napriklad zonam asynchronnych operacii pricom vysledok dalsej zavisi od predchadzajucej tak to jednoducho na vlakna nerozdelis ani keby si sa postavil na hlavu. Takze mas svojim sposobom pravdu, otazka je ako by sa dali obist fyzikalne limity obavam sa ze bude treba objavit nejaku novu technologiu a prejst na nu.
Odpovedať Známka: 2.9 Hodnotiť:
 

HAHaha....na 4 core vypočítam 4 workunity za rovnakú dobu ako jedden na 1core :-)
Odpovedať Známka: -5.0 Hodnotiť:
 

Hahahaha, ano, na Core 2 Quad z roku 2007. Odvtedy existuje vec zvana Turbo Boost, takze nie, na N jadras nevypocitas N-nasobok ako na jednom jadre.

A hahahaha, a este vyrob tie 4 work unity z P-complete uloh, napriklad CVP alebo graph search ordering.


Taky paralelizovany bastlic kodu...
Odpovedať Známka: -2.3 Hodnotiť:
 

Počuli sme slovo pánovo.
Odpovedať Známka: 10.0 Hodnotiť:
 

ano, na E5440 2,83GHz na 3,41 GHz...čiže turbo :-)
A tie workunity nechám robiť tých čo obsluhujú seti@home.
Odpovedať Známka: -1.1 Hodnotiť:
 

Lol, prides do diskusie, kde sa riesi, ze niektore problemy nie su paralelizovatelne, zahras sa na velkeho geroja, kolko workunitov ty zratas na kolko jadras a potom z teba vylezie, ze tie workunity nech tvori niekto iny, not your problem, ty to len spustis... Genius.
Odpovedať Známka: 5.6 Hodnotiť:
 

si ty ale kus kkta...fakt!
si najväčší programátor aký tu kedy bol...paralelné kódenie máš samozrejme v malíčku /len jak to dostať do hlavy/
A v článku neni priamo slovíčko paralelizovanie ani spomenuté, iba určité problémy v prístupe do pamäte viacerými procesormi /čo s tým samozrejme spojené je/
Ty si dalej snívaj o jedinom výkonnom 10GHz jadre...truľo :-)
Odpovedať Známka: -2.5 Hodnotiť:
 

a úplne samozrejmé veci typu:
"ak mas napriklad zoZnam asynchronnych operacii pricom vysledok dalsej zavisi od predchadzajucej tak to jednoducho na vlakna nerozdelis ani keby si sa postavil na hlavu."

nemá ani význam napísať, to je úplne jasné aj mne čo som programoval vykreslenie priamky v BASIC-G na PMD85!! :-)))

A tie WU zo seti@home si mám skompilovať sám zo šumu, ktorý je napríklad momentálne na 325 kHz či ako??? Nemiešaj sa do vecí ktorým nerozumieš...ty trdlo! :-)
Odpovedať Známka: -1.1 Hodnotiť:
 

Lenze ak plati Moorov zakon aj rozpinanie vesmiru a do dvoch svetelnych rokov eti nie je, presne rovnaky vysledok ako seti@home je mozne dat priekazne zrovna uz jednym workunitom - vlastnou hlavou.
Odpovedať Známka: -5.0 Hodnotiť:
 

To sa tu casto nestava ze diskutujuci aboslutne netrafia obsah clanku.

Ide o to, ze na ML treba spracovavat velke.mnozstvo dat a treba vela vypoctovych operacii (najcastesjsie MauMul). Preto sa pouzivaju GPU. Kedze tych vypoctov treba vela zvysjue sa mnozstvo GPU.

Zdravy sedliacky rozum by povedal, ze kedy dam nieco ratat na 8 GPU tak to pojde 8x rychlejsie ako na 1 GPU. Ale nie je to tak, nejde to linearne. Je tam velky bottleneck prave naparameter updaty pre parameter servre. Exiatuju rozne techniky, ktore to kvazi riesia ale je to viac menej len workarround. Intel tymto triafa klinec po hlavicke.
Odpovedať Hodnotiť:
 

* MatMul .
Sorry za preklepy, za to moze pivo.
Odpovedať Hodnotiť:

Pridať komentár