崗位職責(zé):
1、模型優(yōu)化與移植:負(fù)責(zé)深度學(xué)習(xí)模型在TensorRT和RKNN、愛芯等推理引擎上的優(yōu)化與部署,包括模型量化、剪枝、層融合等技術(shù),確保模型在嵌入式設(shè)備上高效運(yùn)行:
2、C++代碼開發(fā):使用C++cuda編程編寫高效、穩(wěn)定且易于維護(hù)的代碼,實現(xiàn)深度學(xué)習(xí)模型的加載、推理及后處理邏輯,確保算法在指定硬件平臺上的順暢集成:
3、SDK集成與適配:熟悉并熟練運(yùn)用TensorRT、RKNN等推理框架的SDK,進(jìn)行接口調(diào)用、API封裝與功能擴(kuò)展,針對不同硬件平臺進(jìn)行針對性適配與優(yōu)化;
4、性能調(diào)優(yōu):對部署后的算法進(jìn)行詳盡的性能分析與調(diào)優(yōu),包括但不限于計算資源利用率、內(nèi)存管理、數(shù)據(jù)流優(yōu)化等,以達(dá)到實時性與功耗效率要求;
5、文檔撰寫與技術(shù)支持:編寫詳細(xì)的算法部署手冊、接口文檔和技術(shù)報告,為內(nèi)部團(tuán)隊及客戶提供必要的技術(shù)支持與培訓(xùn)。
崗位要求:
1、本科及以上學(xué)歷,計算機(jī)科學(xué)、電子工程自動化、數(shù)學(xué)或相關(guān)專業(yè)畢業(yè):
2、深度學(xué)習(xí)基礎(chǔ):深入理解深度神經(jīng)網(wǎng)絡(luò)架構(gòu)、訓(xùn)練原理以及常用模型,如CNN、RNN、Transformer等
3、編程能力:精通C++cuda編程,具備良好的編程習(xí)慣和代碼風(fēng)格,熟悉面向?qū)ο笤O(shè)計原則與軟件工程實踐:
4、推理框架精通:具備豐富的TensorRT和RKNN等部署框架實踐經(jīng)驗,能夠獨立完成模型從訓(xùn)練到部署的全流程工作;
5、硬件理解:了解嵌入式設(shè)備(如GPU、NPU、DSP等)架構(gòu)特點,能夠根據(jù)硬件特性調(diào)整算法實現(xiàn)以最大化利用計算資源
6、項目經(jīng)驗:至少3年以上深度學(xué)習(xí)模型部署經(jīng)驗,有實際項目中成功將深度學(xué)習(xí)模型在TensorRT或RKNN上部署并優(yōu)化的案例:
7、此崗位主要工作職責(zé)以模型在邊端部署為主,其中以tensorrt為主要方向,其他部署框架如rknn、愛芯等后續(xù)也會涉及。