此崗位為外包崗位,介意請(qǐng)勿投遞!
崗位職責(zé):
1.參與超大規(guī)模智算集群的分布式訓(xùn)練部署,確保及時(shí)響應(yīng),遠(yuǎn)程協(xié)助客戶進(jìn)行故障排除。
2.創(chuàng)建和更新技術(shù)文檔、培訓(xùn)材料和常見(jiàn)問(wèn)題解答(FAQ)以供客戶參考。
3.收集客戶反饋和建議,向研發(fā)團(tuán)隊(duì)提供產(chǎn)品改進(jìn)的有益信息。
4.協(xié)助業(yè)務(wù)減少線上問(wèn)題數(shù)量,優(yōu)化研發(fā)工具提升線上問(wèn)題定位效率。
任職要求:
1.具有AI訓(xùn)練領(lǐng)域1年以上工作經(jīng)歷;
2.熟練掌握python,shell語(yǔ)言和基本的調(diào)試技巧;
3.具備良好的客戶服務(wù)意識(shí),能夠高效處理緊急情況。
具有以下條件者優(yōu)先
1.具有AI系統(tǒng)開發(fā)調(diào)試優(yōu)化經(jīng)驗(yàn)
2.熟悉AI領(lǐng)域常見(jiàn)的分布式訓(xùn)練技術(shù)原理和實(shí)現(xiàn),包括不限于:數(shù)據(jù)并行,流水線并行,張量并行
3.了解Pytorch、DeepSpeed、Megatron深度學(xué)習(xí)框架中的一種或多種;
4,本科及以上學(xué)歷,2年及以上工作經(jīng)驗(yàn)