崗位職責(zé):
1. 數(shù)據(jù)收集與管理
o 收集和整理用于微調(diào) LLM 的高質(zhì)量數(shù)據(jù),包括特定領(lǐng)域文本資料、用戶對(duì)話記錄、常見問題解答等。
o 對(duì)數(shù)據(jù)進(jìn)行清洗、標(biāo)注和分類,確保數(shù)據(jù)準(zhǔn)確性、一致性和完整性,符合模型微調(diào)要求。
2. 數(shù)據(jù)安全與合規(guī)
o 負(fù)責(zé)保障數(shù)據(jù)在開發(fā)和使用過程中的安全和合規(guī)性,遵守?cái)?shù)據(jù)隱私法規(guī)。
o 采取加密、訪問控制等措施保護(hù)用戶數(shù)據(jù),確保使用 LLM 過程中數(shù)據(jù)處理符合法律和道德標(biāo)準(zhǔn)。
3. 數(shù)據(jù)注入與更新
o 將整理好的數(shù)據(jù)有效注入到 LLM 中,確保模型能學(xué)習(xí)新的知識(shí)和模式。
o 根據(jù)產(chǎn)品發(fā)展和新業(yè)務(wù)需求,及時(shí)更新數(shù)據(jù),保持模型對(duì)最新信息的敏感度。
崗位要求:
1. 教育背景:本科及以上學(xué)歷,計(jì)算機(jī)科學(xué)、數(shù)據(jù)工程、統(tǒng)計(jì)學(xué)等相關(guān)專業(yè)。
2. 工作經(jīng)驗(yàn):具有 2 年以上數(shù)據(jù)工程相關(guān)工作經(jīng)驗(yàn),有處理自然語言數(shù)據(jù)經(jīng)驗(yàn)者優(yōu)先。
3. 技術(shù)能力:熟練掌握數(shù)據(jù)處理工具和技術(shù),如 SQL、Python 數(shù)據(jù)處理庫(如 Pandas)。熟悉數(shù)據(jù)存儲(chǔ)系統(tǒng),如關(guān)系型數(shù)據(jù)庫(MySQL、PostgreSQL)和非關(guān)系型數(shù)據(jù)庫(MongoDB、Cassandra)。掌握數(shù)據(jù)清洗、標(biāo)注、分類的方法和工具。
4. 安全意識(shí):具備較強(qiáng)的數(shù)據(jù)安全意識(shí),熟悉數(shù)據(jù)隱私法規(guī),能夠確保數(shù)據(jù)在整個(gè)生命周期內(nèi)的安全和合規(guī)。
長沙 - 開福
湖南恒昌醫(yī)藥集團(tuán)股份有限公司長沙 - 岳麓
湖南特泥河乳業(yè)銷售有限公司長沙 - 岳麓
深圳市美正科技有限公司長沙分公司長沙 - 岳麓
湖南炎德文化實(shí)業(yè)有限公司長沙 - 天心
湖南瑞生醫(yī)療科技有限公司長沙 - 岳麓
上海合益眾信生物科技有限公司