工作內(nèi)容:
1、現(xiàn)場技術(shù)支持 在項目現(xiàn)場進(jìn)行辦公,包括出差至指定項目現(xiàn)場; 受理客戶技術(shù)咨詢相關(guān)工作; 處理各類工單并跟蹤回單; 服從客戶現(xiàn)場的管理規(guī)定,包括:作息時間、作業(yè)計劃等;
2、故障處理 項目中故障日常處理; 故障升級處理:對維護團隊能力內(nèi)無法處理的故障,協(xié)調(diào)產(chǎn)品運維經(jīng)理介入故障處理,并跟蹤故障處理進(jìn)度,以及故障處理過程中客戶協(xié)調(diào)溝通; 記錄分析和判斷故障原因,撰寫故障報告;
3、項目巡檢 根據(jù)運維手冊的要求,對項目中平臺或產(chǎn)品系統(tǒng)進(jìn)行日常巡檢工作; 提交項目中各平臺或產(chǎn)品的巡檢報告,并牽頭處理巡檢中發(fā)現(xiàn)的隱患、故障; 根據(jù)具體項目要求提交項目的運行日報/周報/月報/季報中的一個或多個內(nèi)容;
4、數(shù)據(jù)備份和恢復(fù) 對項目中各平臺或產(chǎn)品的控制節(jié)點、計算節(jié)點的配置文件進(jìn)行定期備份工作; 對項目中各平臺或產(chǎn)品涉及的數(shù)據(jù)庫進(jìn)行定期備份工作; 對項目中所涉及到的重點業(yè)務(wù)(虛機、數(shù)據(jù)、文件)進(jìn)行定期備份工作; 備份工作采用自動化工具,由各產(chǎn)品運維團隊提供,運維支撐服務(wù)人員針對項目環(huán)境將備份工具進(jìn)行調(diào)整,并部署在項目環(huán)境中; 對自動化備份結(jié)果進(jìn)行巡檢和確認(rèn),對備份中遇到的報錯進(jìn)行處理; 對乙方自身能力無法處理的備份事件,執(zhí)行派單流程,提交給產(chǎn)品運維團隊處理,并跟蹤處理結(jié)果; 搭建測試環(huán)境,對備份的配置、數(shù)據(jù)、文件、重點業(yè)務(wù)進(jìn)行恢復(fù)演練; 對恢復(fù)演練中遇到的問題,提交產(chǎn)品運維團隊處理,并跟蹤處理結(jié)果;
5、應(yīng)急演練 應(yīng)急保障類型分為:軟件故障和硬件故障,發(fā)生故障后,維護工程師應(yīng)第一時間定位故障類型; 故障類型為硬件故障,參照產(chǎn)品運維手冊中基于硬件級別應(yīng)急操作手冊進(jìn)行應(yīng)急操作; 故障類型為軟件故障,參照產(chǎn)品運維手冊中基于軟件級別應(yīng)急操作手冊進(jìn)行應(yīng)急操作; 定期向產(chǎn)品運維團隊反饋運維手冊中需要改進(jìn)的地方。
技術(shù)要求:
1、負(fù)責(zé)大數(shù)據(jù)平臺的管理、優(yōu)化、監(jiān)控報警,保障平臺服務(wù)7*24穩(wěn)定可靠高效運行;
2、作為售后一線人員,及時響應(yīng)業(yè)務(wù)部門要求,做好需求整理及梳理工作;
3、負(fù)責(zé)Hadoop/spark/Kafka等服務(wù)的業(yè)務(wù)監(jiān)控、應(yīng)急響應(yīng)、容量規(guī)劃等;
4、能夠協(xié)助完成大數(shù)據(jù)系統(tǒng)的數(shù)據(jù)備份、配置核查工作;
5、找出大數(shù)據(jù)軟件中存在的隱患和問題,能夠提出合理的解決方案 ;
6、負(fù)責(zé)Hadoop及相關(guān)組件維護,包括客戶投訴處理、故障處理、巡檢管理、系統(tǒng)優(yōu)化工作;
7、負(fù)責(zé)Hadoop生態(tài)組件的配置核查、備份、日常維護、性能調(diào)優(yōu);
8、熟悉主流Linux操作系統(tǒng),能夠熟練的編寫linux腳本,能進(jìn)行日常的維護和管理。
工作年限2年及以上,學(xué)信網(wǎng)可查的本科及以上學(xué)歷,或?qū)I疽部山邮堋?/div>