公司主要業(yè)務(wù)為科技成果標(biāo)準(zhǔn)化評價(jià)體系的培訓(xùn)和咨詢等,參與制定行業(yè)標(biāo)準(zhǔn),并且是行業(yè)國家標(biāo)準(zhǔn)的主要完成人。每年培訓(xùn)場次100+,涉及全國50余省市。圍繞推動(dòng)科技成果轉(zhuǎn)化,推動(dòng)新質(zhì)生產(chǎn)力的發(fā)展,通過有效的技術(shù)手段來實(shí)現(xiàn)“產(chǎn)業(yè)側(cè)的技術(shù)需求”與“高校側(cè)科研成果”的精準(zhǔn)匹配,而實(shí)現(xiàn)以文本為載體的需求和成果的語義表征,必然遭遇來自“一詞多義”的挑戰(zhàn)。 通過評估相關(guān)詞匯之間的相似度,可以進(jìn)行文本分類、模糊搜索、智能匹配、增強(qiáng)人機(jī)對話的理解,還能用于知識圖譜構(gòu)建及知識增強(qiáng)。隨著基于內(nèi)容的推薦技術(shù)的快速發(fā)展和廣泛應(yīng)用,內(nèi)容的關(guān)鍵詞提取和降噪消歧成為推薦性能優(yōu)劣的關(guān)鍵因素,雖然有一些研究通過擴(kuò)展短文本的詞義或描述文本來增強(qiáng)語義,但大部分模型在做信息的加法,而很少考慮進(jìn)行不相關(guān)或者弱相關(guān)信息的過濾,往往難以取得很好的性能。多義性是NLP、機(jī)器學(xué)習(xí)中常見的挑戰(zhàn),而中文的語義分析更為復(fù)雜。為了更加準(zhǔn)確的語義描述,信息擴(kuò)展的方式在很多方法中被采用,但由于大部分模型在做信息的加法,而很少考慮進(jìn)行不相關(guān)或者弱相關(guān)信息的過濾,往往難以取得很好的性能。本文提出了一種基于互場景感知與多模態(tài)增強(qiáng)的表征方法,通過擴(kuò)展詞對中的詞典、描述文本、以及圖片信息,分別在各個(gè)模態(tài)下進(jìn)行相似度比較,將相關(guān)性較弱的擴(kuò)展信息進(jìn)行基于場景化的過濾降噪,再將三種模態(tài)數(shù)據(jù)進(jìn)行融合比較,在五個(gè)公開的數(shù)據(jù)集中證明了本算法的優(yōu)越性。