崗位職責描述:
1.負責安裝和配置GPU服務器上的系統(tǒng)和驅(qū)動程序,能夠海量部署服務器,確保其正常運行并達到性能標準;
2.負責GPU服務器的維護和優(yōu)化;
3. 負責GPU集群的搭建和管理以及集群方案的制定及優(yōu)化;
4.輔助關(guān)鍵軟件的設(shè)計、開發(fā)、調(diào)試、集成等;
5.熟悉本領(lǐng)域的建設(shè)和發(fā)展規(guī)劃;
6.熟悉本領(lǐng)域科學研究相關(guān)的科研條件建設(shè);
7.可以編制服務器技術(shù)解決方案及產(chǎn)品規(guī)格書等;
8.OEM廠商產(chǎn)品的檢測工作等。
任職要求:
1.本科及以上學歷,具有3年以上工作經(jīng)歷,年齡不超過35周歲(特別優(yōu)秀者,可適當放寬);
2.熟悉GPU服務器,具備豐富的GPU硬件維護經(jīng)驗;
3.熟悉cuda架構(gòu),熟悉主流訓練框架;
4.具有大數(shù)據(jù)中心工作經(jīng)驗或大模型訓練和應用工作經(jīng)驗者優(yōu)先;
5.具有良好的溝通能力、表達能力、團隊協(xié)作能力,能夠獨立開展調(diào)研工作。