崗位描述:
1. 針對具身智能大模型,進行數(shù)據(jù)的采集、爬取、清洗、處理、優(yōu)化等全流程,對模型預訓練和微調(diào)提供高質(zhì)量數(shù)據(jù)。最終形成數(shù)據(jù)-模型閉環(huán)。
2. 構(gòu)建數(shù)據(jù)全鏈路(data-centric)的平臺和工具,統(tǒng)一多模態(tài)數(shù)據(jù)的采集、處理、查詢、管理。
3. 利用CV算法、多模態(tài)模型等處理視頻、圖片等多模態(tài)數(shù)據(jù),如物體檢測、視頻描述等等。
4. 指導和管理大規(guī)模數(shù)據(jù)標注工作。
崗位要求:
1. 計算機、軟件工程、統(tǒng)計等相關(guān)專業(yè)畢業(yè),本科及以上學歷。
2. 熟悉Python、Java或Go編程語言,熟悉SQL,熟悉Linux系統(tǒng),熟悉git,具備扎實的數(shù)據(jù)結(jié)構(gòu)和算法基礎(chǔ)。
3. 熟悉Hadoop、Spark、Flink等大數(shù)據(jù)處理框架,具備實際項目經(jīng)驗。
4. 有一定模型算法能力,能夠借助開源項目獨立訓練CV模型或者多模態(tài)模型。
5. 具備一定的前后端能力,能夠做簡單的后端開發(fā)。具備利用開源框架streamlit等工具開發(fā)demo的能力。
6. 具備良好的團隊合作精神、溝通能力、學習能力和解決問題的能力。
深圳 - 光明
南京立航規(guī)劃設(shè)計有限公司深圳 - 龍華
富聯(lián)精密電子(鄭州)有限公司深圳 - 光明
深圳市納研科技有限公司深圳 - 龍崗
軟通動力信息技術(shù)(集團)股份有限公司深圳 - 南山
深圳市科思科技股份有限公司深圳 - 光明
英威騰