DSL.sk - Nová technológia pre pripojenie akcelerátorov

neprihlásený

Štvrtok, 18. apríla 2024, dnes má meniny Valér

Nová technológia pre pripojenie akcelerátorov

Značky: Intel

DSL.sk, 22.3.2019

Spoločnosť Intel aktuálne informovala o vyvinutí novej technológie a štandardu CXL pre pripojenie výkonných hardvérových akcelerátorov vyžadujúcich aj vysoké rýchlosti komunikácie.

Technológiu CXL, Compute Express Link, vyvinul Intel a následne ju posúva konzorciu viacerých popredných IT spoločností, ktoré ju budú ďalej rozvíjať. Sú v ňom okrem Intelu aj HPE, Dell EMC, Cisco, Huawei, Microsoft, Google, Facebook a Alibaba.

Rozličné akcelerátory sú čoraz dôležitejším komponentom najmä serverových systémov, pričom v poslednom období sa nasadzujú okrem iného často pre akceleráciu metód umelej inteligencie a strojového učenia.

CXL je fyzicky založená na novej pripravovanej verzii rozhrania PCI Express 5.0. To v novej verzii zdvojnásobuje rýchlosť oproti ešte len prichádzajúcej PCI Express 4.0 a dokáže po jednej linke prenášať dáta rýchlosťou 3.9 GB/s a cez x16 slot rýchlosťou 63 GB/s.

Podstatnou vlastnosťou CXL je zabezpečenie tzv. pamäťovej koherencie, podľa popisu zrejme priamo samotnou technológiou. V prípade viacerých procesorov v jednom systéme pristupujúcich do pamäte, CPU a procesorov akcelerátorov, vzniká problém so zmenou dát v pamäti jedným procesorom ale nacachovaných starších hodnôt ostatnými. Systém má zabezpečenú pamäťovú koherenciu, ak má vyriešený tento problém a zabezpečené správne dáta pre všetky procesory.

CXL bude konkurovať zrejme najmä podobnej technológii CCIX, cache coherent interconnect for accelerators. Tá je tiež nadstavbou PCI Express fungujúcou na rýchlostiach PCI Express 4.0 so 16 GT/s prípadne ešte vyšších s 25 GT/s. Nvidia zase používa technológiu NVLink.

Špecifikácia prvej generácie CXL má byť dostupná v prvom polroku tohto roka a čo sa týka produktov, minimálne Intel avizuje podporu CXL vo svojich produktoch pre dátové centrá na rok 2021.

Najnovšie články:

	Pôsobivého dvojnohého robota Atlas nahradí úplne nová elektrická verzia
	O2 spustilo predaj na diaľku. Namiesto eID sa fotí tvár a občiansky, nedá sa objednať eSIM ani predplatenka
	Klon populárnej databázy Redis od Linux Foundation k dispozícii v prvej verzii
	Helikoptéra na Marse bude zbierať dáta aj po strate komunikácie so Zemou
	Vývoj pôsobivého dvojnohého robota prekvapivo končí
	Spustená výrobca QLC flash pamäte s viac ako 200 vrstvami
	Batérie vyhodené z vesmírnej ISS neočakávane nezhoreli a poškodili dom v USA
	Sprístupnená beta verzia Ubuntu 24.04 LTS
	Nový CPU Apple M4 majú dostať všetky Macy, s výnimkou najvyšších najneskôr do jari
	Samsung sa v predaji smartfónov vrátil pred Apple

Diskusia:

Ale no tak
Od: Nfjdjsksj | Pridané: 22.3.2019 23:05

AMD nas dobieha vo vykone? To nic, vymyslime si novy proprieatarny standard

Odpovedať Známka: 1.0 Hodnotiť:

Re: Ale no tak
Od: fvfdbdfb | Pridané: 23.3.2019 10:58

AMD niekoho dobieha?

Odpovedať Známka: -3.8 Hodnotiť:

Re: Ale no tak
Od: Jamicon | Pridané: 23.3.2019 11:42

Nie, už ho predbehol.

Odpovedať Známka: 6.3 Hodnotiť:

Re: Ale no tak
Od: xfgysdgys&d | Pridané: 24.3.2019 18:20

AMD nas predbieha vo vykone? To nic, vymyslime si novy proprieatarny standard

Odpovedať Známka: -5.0 Hodnotiť:

ničivý praktik S005E00120
Od: syntaxterrorXX. X | Pridané: 23.3.2019 16:55

Holt, vymysliet proprieatarnu alternativu k neexistujucemu slobodnemu standardu je objektivne priekazne zapeklitejsie.

Odpovedať Známka: -2.9 Hodnotiť:

gdsgsdg
Od: dgsgsg | Pridané: 23.3.2019 0:47

nove a rychlejsie

Odpovedať Známka: 3.3 Hodnotiť:

Re: gdsgsdg
Od: fvfdbdfb | Pridané: 23.3.2019 10:59

lepšie ako nové a krajšie.

Odpovedať Známka: 6.7 Hodnotiť:

Re: gdsgsdg
Od: miro j. | Pridané: 24.3.2019 18:38

hej intel , kolko je 2+2....5 hovori intel instantne...ale to nie je dobre...ale bolo to rychlo...hovori intel...

Odpovedať Známka: -2.5 Hodnotiť:

Ide to zlym smerom.
Od: Jadierok | Pridané: 23.3.2019 11:37

Treba zvazit cestu jedneho silneho jadra s jednym vlaknom a nie xy jadier, kazde s dvoma + vlaknami. Je to slepa vyvojova vetva, ku ktorej potom treba vymyslat riesenia uvedene v clanku. Jedno poriadne jadro, disk s uz implementovanou RAM a grafickou pamatou, zuvukovou kartou a ostatne nalezitosti. Desktop bude mat minimalnu velkost a poriadny vykon. Ostatne je slepa ulica.

Odpovedať Známka: -7.9 Hodnotiť:

Re: Ide to zlym smerom.
Od: Jamicon | Pridané: 23.3.2019 11:51

Slepý si jedine ty. Dokonca už aj widle vedia pracovať s viacerými vláknami, akurát niektoré hry na starých enginoch s tým majú problém.

Odpovedať Známka: 6.7 Hodnotiť:

Re: Ide to zlym smerom.
Od: bekes caba | Pridané: 23.3.2019 12:38

Problem je ze frekvenciu jedneho jadra CPU nejde zvysovat donekonecna naraza to na technicke limity. Takze tam kde nestaci single thread nastupuje paralerizacia. Mas pravdu v tom ze pre programatorov je omnoho komplikovanejsie pisat viac jadrove aplikacie a rozhodne zo 4jadroveho CPU nevymackas 4x vacsi vykon ako z 1neho jadra. Preto kodit multijadrove aplikacie nemozu ziadni php bastlici ale skutocni programatori, ktori vedia v imperativnych jazykoch pouzivat vlakna, alebo ovladaju nejaky funkcionalny jazyk. Funkcionalne jazyky (nie vsetky bohuzial) umoznuju implicitny paralelizmus a fakt sa v nich tieto veci kodia dost dobre, problem je ze sa to hodi len na niektore typy uloh: ak mas napriklad zonam asynchronnych operacii pricom vysledok dalsej zavisi od predchadzajucej tak to jednoducho na vlakna nerozdelis ani keby si sa postavil na hlavu. Takze mas svojim sposobom pravdu, otazka je ako by sa dali obist fyzikalne limity obavam sa ze bude treba objavit nejaku novu technologiu a prejst na nu.

Odpovedať Známka: 2.9 Hodnotiť:

Re: Ide to zlym smerom.
Od: ffdf | Pridané: 23.3.2019 14:03

HAHaha....na 4 core vypočítam 4 workunity za rovnakú dobu ako jedden na 1core :-)

Odpovedať Známka: -5.0 Hodnotiť:

Re: Ide to zlym smerom.
Od: Priekaz | Pridané: 23.3.2019 16:29

Hahahaha, ano, na Core 2 Quad z roku 2007. Odvtedy existuje vec zvana Turbo Boost, takze nie, na N jadras nevypocitas N-nasobok ako na jednom jadre.

A hahahaha, a este vyrob tie 4 work unity z P-complete uloh, napriklad CVP alebo graph search ordering.

Taky paralelizovany bastlic kodu...

Odpovedať Známka: -2.3 Hodnotiť:

Re: Ide to zlym smerom.
Od: Ušatý | Pridané: 23.3.2019 20:23

Počuli sme slovo pánovo.

Odpovedať Známka: 10.0 Hodnotiť:

Re: Ide to zlym smerom.
Od: ffdf | Pridané: 23.3.2019 21:58

ano, na E5440 2,83GHz na 3,41 GHz...čiže turbo :-)
A tie workunity nechám robiť tých čo obsluhujú seti@home.

Odpovedať Známka: -1.1 Hodnotiť:

Re: Ide to zlym smerom.
Od: Priekaz | Pridané: 23.3.2019 23:23

Lol, prides do diskusie, kde sa riesi, ze niektore problemy nie su paralelizovatelne, zahras sa na velkeho geroja, kolko workunitov ty zratas na kolko jadras a potom z teba vylezie, ze tie workunity nech tvori niekto iny, not your problem, ty to len spustis... Genius.

Odpovedať Známka: 5.6 Hodnotiť:

Re: Ide to zlym smerom.
Od: ffdf | Pridané: 24.3.2019 13:02

si ty ale kus kkta...fakt!
si najväčší programátor aký tu kedy bol...paralelné kódenie máš samozrejme v malíčku /len jak to dostať do hlavy/
A v článku neni priamo slovíčko paralelizovanie ani spomenuté, iba určité problémy v prístupe do pamäte viacerými procesormi /čo s tým samozrejme spojené je/
Ty si dalej snívaj o jedinom výkonnom 10GHz jadre...truľo :-)

Odpovedať Známka: -2.5 Hodnotiť:

Re: Ide to zlym smerom.
Od: ffdf | Pridané: 24.3.2019 13:07

a úplne samozrejmé veci typu:
"ak mas napriklad zoZnam asynchronnych operacii pricom vysledok dalsej zavisi od predchadzajucej tak to jednoducho na vlakna nerozdelis ani keby si sa postavil na hlavu."

nemá ani význam napísať, to je úplne jasné aj mne čo som programoval vykreslenie priamky v BASIC-G na PMD85!! :-)))

A tie WU zo seti@home si mám skompilovať sám zo šumu, ktorý je napríklad momentálne na 325 kHz či ako??? Nemiešaj sa do vecí ktorým nerozumieš...ty trdlo! :-)

Odpovedať Známka: -1.1 Hodnotiť:

ultraradikalny fakticizmus
Od: syntaxterrorXX. X | Pridané: 24.3.2019 9:31

Lenze ak plati Moorov zakon aj rozpinanie vesmiru a do dvoch svetelnych rokov eti nie je, presne rovnaky vysledok ako seti@home je mozne dat priekazne zrovna uz jednym workunitom - vlastnou hlavou.

Odpovedať Známka: -5.0 Hodnotiť:

Nepochopeny
Od reg.: Mam nejake | Pridané: 24.3.2019 23:03

To sa tu casto nestava ze diskutujuci aboslutne netrafia obsah clanku.

Ide o to, ze na ML treba spracovavat velke.mnozstvo dat a treba vela vypoctovych operacii (najcastesjsie MauMul). Preto sa pouzivaju GPU. Kedze tych vypoctov treba vela zvysjue sa mnozstvo GPU.

Zdravy sedliacky rozum by povedal, ze kedy dam nieco ratat na 8 GPU tak to pojde 8x rychlejsie ako na 1 GPU. Ale nie je to tak, nejde to linearne. Je tam velky bottleneck prave naparameter updaty pre parameter servre. Exiatuju rozne techniky, ktore to kvazi riesia ale je to viac menej len workarround. Intel tymto triafa klinec po hlavicke.

Odpovedať Hodnotiť:

Re: Nepochopeny
Od reg.: Mam nejake | Pridané: 24.3.2019 23:04

* MatMul .
Sorry za preklepy, za to moze pivo.

Odpovedať Hodnotiť:

Pridať komentár