崗位職責:
1、 負責文檔理解大模型研發(fā),基于多模態(tài)大模型底座進行整體的架構(gòu)設(shè)計,支持法律文書場景下的語義理解,如文檔OCR、分類、信息抽取、問答等;
2、 負責OCR方向的模型研發(fā),包括OCR識別、表格識別、手寫識別等任務(wù)的研發(fā),進行模型的預訓練與監(jiān)督微調(diào)。
3、 負責圖像、語音等模態(tài)的相關(guān)的研發(fā)應用與優(yōu)化,包括圖像生成、語音識別、TTS等。
4、 負責數(shù)據(jù)集構(gòu)建,包括開放數(shù)據(jù)收集、自動合成、人工標注方案制定等。
任職要求:
1、 計算機、數(shù)學等相關(guān)專業(yè),統(tǒng)招本科及以上學歷,3年及以上工作經(jīng)驗,碩士、博士優(yōu)先,有相關(guān)工作經(jīng)歷或?qū)嶒炇已芯勘尘埃?/p>
2、 對主流多模態(tài)模型CLIP、LLava等有較好的理解。
3、 對多模態(tài)預訓練、多模態(tài)模型微調(diào)、圖像算法、語音處理其中一個或者多個領(lǐng)域的處理經(jīng)驗,并對相關(guān)工作有深刻的理解。
4、 開發(fā)基礎(chǔ)扎實,有數(shù)據(jù)競賽經(jīng)驗、開源項目經(jīng)驗者優(yōu)先。
5、 有強烈的技術(shù)熱情,對新技術(shù)有較強的學習能力和學習經(jīng)驗。
南京 - 江寧
南京天洑軟件有限公司南京 - 江寧
南京天洑軟件有限公司南京 - 雨花臺
外企德科數(shù)字技術(shù)有限公司南京
北京中安智能信息科技有限公司南京 - 雨花臺
上海索辰信息科技股份有限公司南京 - 秦淮
南京邁特望科技股份有限公司