當前位置: 華文問答 > 數碼

作為一名自然語言處理研究者,2024 年有哪些研究方向更有潛力?

2023-11-30數碼

作為一名自然語言處理領域(NLP)的工作者,個人覺得未來幾年研究熱點有兩個:大模型(LLM)和多模態(Multimodal),下面粗略展開說下:

一、圍繞大模型(LLM)產生的各種研究方向

(1)大模型的訓練,具體包括數據的處理、模型的框架(位置編碼、norm、loss等策略最佳化)、訓練效率(主要attention、梯度最佳化等環節),訓練策略(SFT、RLHF 等),這部份很吃硬件資源,擁有豐富GPU資源的人才能研究這個方向;

(2)大模型的推理,具體包括量化、解碼、條件控制等,以及工程方面,這部份目前研究的相對少一些;

(3)大模型的微調技術,如lora、P-tuning,prompt相關的,該方向主要基於基座大模型進行高效最佳化,相對來說,資源要求小很多;

(4)大模型在問答方向的套用,這是目前大模型主攻的方向,但這個領域可以細分很多,目前比較有前景的兩個技術方向,一是大模型+檢索(LLM+RAG),二是LLM agent方向,這個也有點類似當前熱議的混合專家系統(MOE);

(5)大模型在NLP傳統任務的套用,如利用LLM解決語意問題,利用LLM進行資訊抽取、或者LLM與KG的結合,該方向適合大部份來研究,並能容易發表論文;

(6)大模型在自動化方向的套用,這個方向比較小眾,但若取得進展,將產生巨大的影響;

(7)小模型方向,現在都追求大模型(mode size 越來越大),但在很多場景受資源限制,如何反方向去研究,開發小而精的模型,也是一種追求高性價比的選擇;

二、多模態的研究方向

(1)text2img方向,目前這個方向也在跟LLM結合,或者說LLM要具備多模態處理的能力;

(2)擴散模型(diffusion model),今年是被LLM蓋住了,本來最熱的研究方向是它;

(3)音訊/影片方向,類似text2img發展趨勢,利用text來自動生成音訊或者動畫影片,也是遊戲領域很在乎的一個方向;

以上個人看法,具體還的看個人的研究興趣+擁有的資源。最後推薦幾篇研究綜述,便於從中了解更多的研究方向和進展。

【1】Efficient Large Language Models: A Survey

【2】Data Management For Large Language Models: A Survey

【3】Large LanguageModelsMeet Computer Vision: A BriefSurvey

【4】Survey of Hallucination in Natural Language Generation

【5】 Large Language Models for Robotics: A Survey