工作職責(zé):
1、負(fù)責(zé)公司算力平臺(tái)的搭建、部署、監(jiān)控、調(diào)優(yōu)、升級(jí)、日常維護(hù)等工作;
2、參與公司算力平臺(tái)運(yùn)維流程、制度和規(guī)范的制訂;
3、參與公司算力平臺(tái)監(jiān)控體系和應(yīng)急響應(yīng)機(jī)制的建立;
4、參與公司算力平臺(tái)自動(dòng)化運(yùn)維工具的設(shè)計(jì)和實(shí)施;
5、參與算力類服務(wù)的客戶交流,開(kāi)展需求分析,提供解決方案和技術(shù)支撐;
6、持續(xù)跟蹤和研究最前沿的算力平臺(tái)維護(hù)和應(yīng)用技術(shù),開(kāi)展相關(guān)技術(shù)創(chuàng)新;
7、參與各類保障和維護(hù)工作。
崗位要求:
1、計(jì)算機(jī)、通信等相關(guān)專業(yè)背景;
2、具有云平臺(tái)維護(hù)、云平臺(tái)搭建和業(yè)務(wù)遷云等相關(guān)工作經(jīng)驗(yàn);
3、熟悉云計(jì)算主要技術(shù)架構(gòu)和技術(shù)特點(diǎn),了解openstack云平臺(tái)運(yùn)維體系,容器和k8s等容器管理架構(gòu)的運(yùn)維體系,熟悉相關(guān)虛擬化技術(shù);
4、熟悉Linux操作,了解Ansible,Terraform等自動(dòng)化運(yùn)維開(kāi)源工具;
5、熟練使用Python語(yǔ)言,熟練掌握深度學(xué)習(xí)框架PyTorch,掌握機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法原理,精通一種Web開(kāi)發(fā)框架(例如django、flask等);
6、熟悉不同算力芯片的基本概念,了解人工智能開(kāi)發(fā)框架的基本邏輯。