1.負(fù)責(zé)智能算力產(chǎn)品的規(guī)劃、GPU/DPU等異構(gòu)計(jì)算網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)、RDMA/vGPU等核心技術(shù)、智能算力網(wǎng)絡(luò)整體方案交付;
2.組織智能算力網(wǎng)絡(luò)與各GPU/DPU廠家、各種行業(yè)AI應(yīng)用合作,提升各種應(yīng)用模型下的系統(tǒng)性能;
3.探索智能算力網(wǎng)絡(luò)新技術(shù)并應(yīng)用到產(chǎn)品,使產(chǎn)品持續(xù)保持在技術(shù)上的競爭力;
4.IDC網(wǎng)絡(luò)的規(guī)劃、建設(shè),分析AI大模型、算力網(wǎng)絡(luò)、端網(wǎng)協(xié)同相關(guān)領(lǐng)域的發(fā)展趨勢和新技術(shù)。
5.支撐智算類重點(diǎn)項(xiàng)目的拓展,包括售前支持、解決方案設(shè)計(jì)、重大技術(shù)交流、招投標(biāo)等。
(二)任職資格1.本科及以上學(xué)歷,3 年以上工作經(jīng)驗(yàn),具備 CCNA 證書或等效的專業(yè)知識(shí)等經(jīng)驗(yàn)者優(yōu)先;
2.熟悉華為昇騰、NVIDIA GPU或其它GPU千卡智算數(shù)據(jù)中心的規(guī)劃與方案設(shè)計(jì)、熟悉大模型訓(xùn)練關(guān)鍵監(jiān)控和運(yùn)維等;
3.熟悉智算中心大規(guī)模ROCE網(wǎng)絡(luò)規(guī)劃,設(shè)計(jì)、性能調(diào)優(yōu)和整體交付;了解網(wǎng)絡(luò)規(guī)劃對大模型訓(xùn)練的關(guān)鍵需求,收斂設(shè)計(jì)等;
4.熟悉網(wǎng)絡(luò)設(shè)計(jì)需要的知識(shí):路由協(xié)議如 OSPF/BGP、業(yè)務(wù)需求與容量規(guī)劃,有實(shí)際的大型網(wǎng)絡(luò)設(shè)計(jì)和運(yùn)行經(jīng)驗(yàn);
5.熟悉大規(guī)模RDMA、IDC網(wǎng)絡(luò)的設(shè)計(jì)與開發(fā)、質(zhì)量調(diào)優(yōu),熟悉Infiniband、RoCEv2等工作原理;
6.熟悉主流網(wǎng)絡(luò)廠商的設(shè)備,熟悉網(wǎng)絡(luò)建設(shè)中的各種成本因素;
7.了解機(jī)器學(xué)習(xí)框架 Tensorflow、PyTorch,熟悉分布式存儲(chǔ)優(yōu)先,熟悉智算中心訓(xùn)練過程中集群調(diào)度,斷點(diǎn)續(xù)訓(xùn),大模型訓(xùn)練性能優(yōu)化,有實(shí)踐經(jīng)驗(yàn)的優(yōu)先;
8.對云計(jì)算技術(shù)有熱情,新技術(shù)的接受能力以及學(xué)習(xí)能力要強(qiáng),有智算或者云計(jì)算大中型項(xiàng)目主導(dǎo)實(shí)操經(jīng)驗(yàn)、大型調(diào)優(yōu)經(jīng)驗(yàn)等優(yōu)先。
福州 - 馬尾
飛毛腿集團(tuán)福州 - 臺(tái)江
福建龍?zhí)锞W(wǎng)絡(luò)科技有限公司福州 - 臺(tái)江
福州鼎訊電子技術(shù)有限公司福州 - 鼓樓
福建數(shù)創(chuàng)聯(lián)合科技有限公司福州 - 連江
中船賽思億(福建)電氣科技有限公司福州 - 鼓樓
福建奧通邁勝電力科技有限公司