Nagsumite si Tachyum ng Bid para Bumuo ng 20 Exaflops Supercomputer
Sinabi ni Tachyum noong Martes na nagsumite ito ng bid sa Department of Energy para bumuo ng 20 exaflops supercomputer sa 2025. Ang makina ay ibabatay sa susunod na henerasyong Prodigy processors ng kumpanya na nagtatampok ng proprietary microarchitecture na maaaring magamit para sa iba’t ibang uri ng workloads .
Nais ng US DoE na maihatid ang isang 20 exaflops supercomputer na may 20MW–60MW na konsumo ng kuryente bago ang 2025. Nakatakdang i-install ang system sa Oak Ridge National Laboratory (ORNL) at makadagdag sa Frontier system ng lab na nag-online sa unang bahagi ng taong ito.
Hindi ibinunyag ni Tachyum kung aling hardware ang iminungkahi nito sa DoE, ngunit sinasabi lamang nito na mayroon itong 128-core na Prodigy processor ngayon pati na rin ang isang mas mahusay na gumaganang Prodigy 2 processor sa roadmap nito, kaya ligtas na sabihin na sa 2025 ito ay nasa kamay ang huli at maaari nitong matugunan ang paparating na sistema.
Ang Tachyum’s Prodigy ay isang unibersal na homogenous na processor na nag-iimpake ng hanggang 128 proprietary 64-bit VLIW cores na nagtatampok ng dalawang 1024-bit vector units bawat core at isang 4096-bit matrix unit bawat core. Inaasahan ng Tachyum na ang flagship Prodigy T16128-AIX processor nito (nagbubukas sa bagong tab) ay mag-aalok ng hanggang 90 FP64 teraflops para sa HPC pati na rin hanggang 12 ‘AI petaflops’ para sa AI inference at pagsasanay (marahil kapag nagpapatakbo ng INT8 o FP8 na mga workload). Ang Prodigy ay kumokonsumo ng hanggang 950W at gumagamit ng likidong paglamig.
Iyon lang bago idemanda ng Tachyum si Cadence, ang tagapagbigay ng intelektwal na ari-arian nito, para sa mas mababa kaysa sa inaasahang pagganap ng processor ng Prodigy nito. Wala kaming ideya kung ano ang kasalukuyang inaasahan ng pagganap para sa chip.
Sa teorya, maaaring paganahin ng Tachyum ang isang exaflops system gamit ang higit sa 11,000 ng mga Prodigy processor nito, kahit na napakalaki ng paggamit ng kuryente sa naturang makina. Marahil, ang Prodigy 2 ay may mas magandang pagkakataon na matugunan ang mga pangangailangan ng isang susunod na henerasyong exascale system kaysa sa orihinal na Prodigy.
Kasalukuyang mayroong isang exaflops-class supercomputer sa US, ang 1.1 exaflops Frontier system sa Oak Ridge National Laboratory (ORNL) na batay sa 64-core EPYC CPU ng AMD pati na rin ang Instinct MI250X compute GPU. May dalawa pang exascale system na binuo sa USA, ang 2 exaflops Aurora machine na pinapagana ng Intel’s 4thGeneration Xeon Scalable processors at Xe-HPC compute GPUs (aka, Ponte Vecchio) pati na rin ang “>2 exaflops” El Capitan supercomputer batay sa Mga EPYC na CPU at Instinct MI300 na GPU ng arkitektura ng Zen 4 ng AMD.
Isa sa mga kawili-wiling bagay tungkol sa mga supercomputing plan ng DoE ay na mula ngayon ay gusto nitong i-upgrade ang mga kakayahan sa pag-compute na may mataas na pagganap nito tuwing 12–24 na buwan, hindi bawat 4–5 taon. Bilang resulta, ang DoE ay magiging mas sabik na magpatibay ng mga kakaibang arkitektura tulad ng Tachyum’s Prodigy kaysa sa ngayon.
“Nais din naming galugarin ang pagbuo ng isang diskarte na lumalayo mula sa mga monolitikong pagkuha patungo sa isang modelo para sa pagpapagana ng mas mabilis na mga yugto ng pag-upgrade ng mga naka-deploy na system, upang paganahin ang mas mabilis na pagbabago sa hardware at software,” sabi ng isang dokumento ng DoE. “Ang isang posibleng diskarte ay magsasama ng mas mataas na muling paggamit ng mga umiiral na imprastraktura upang ang mga pag-upgrade ay modular. Ang isang layunin ay upang muling isipin ang arkitektura ng mga system at isang mahusay na proseso ng pagkuha na nagbibigay-daan sa patuloy na pag-iniksyon ng mga teknolohikal na pagsulong sa isang pasilidad (hal., bawat 12–24 na buwan sa halip kaysa sa bawat 4–5 taon). Ang pag-unawa sa mga tradeoff ng mga diskarteng ito ay isang layunin ng RFI na ito, at nag-iimbita kami ng mga tugon na isama ang mga nakikitang benepisyo at/o disadvantage ng modular na diskarte sa pag-upgrade na ito.”
Isa sa mga bentahe ng Tachyum’s Prodigy kumpara sa mga tradisyunal na CPU at GPU para sa AI at HPC na mga workload ay ang pagkakaayon nito para sa parehong uri ng mga workload, kaya naman magagamit ang Prodigy para sa mga workload ng AI kapag hindi ginagamit ang mga kakayahan ng HPC nito at vice versa. Maaaring gamitin o hindi ng DoE ang Tachyum para sa alinman sa mga paparating na supercomputer nito, ngunit umaasa ang kumpanya na mabigyan ng naaangkop na kontrata.