作為一名自然語言處理研究者，2024 年有哪些研究方向更有潛力？

2023-11-30數碼

作為一名自然語言處理領域（NLP）的工作者，個人覺得未來幾年研究熱點有兩個：大模型（LLM）和多模態（Multimodal），下面粗略展開說下：

一、圍繞大模型（LLM）產生的各種研究方向

（1）大模型的訓練，具體包括數據的處理、模型的框架（位置編碼、norm、loss等策略最佳化）、訓練效率（主要attention、梯度最佳化等環節），訓練策略（SFT、RLHF 等），這部份很吃硬件資源，擁有豐富GPU資源的人才能研究這個方向；

（2）大模型的推理，具體包括量化、解碼、條件控制等，以及工程方面，這部份目前研究的相對少一些；

（3）大模型的微調技術，如lora、P-tuning，prompt相關的，該方向主要基於基座大模型進行高效最佳化，相對來說，資源要求小很多；

（4）大模型在問答方向的套用，這是目前大模型主攻的方向，但這個領域可以細分很多，目前比較有前景的兩個技術方向，一是大模型+檢索（LLM+RAG），二是LLM agent方向，這個也有點類似當前熱議的混合專家系統（MOE）；

（5）大模型在NLP傳統任務的套用，如利用LLM解決語意問題，利用LLM進行資訊抽取、或者LLM與KG的結合，該方向適合大部份來研究，並能容易發表論文；

（6）大模型在自動化方向的套用，這個方向比較小眾，但若取得進展，將產生巨大的影響；

（7）小模型方向，現在都追求大模型（mode size 越來越大），但在很多場景受資源限制，如何反方向去研究，開發小而精的模型，也是一種追求高性價比的選擇；

二、多模態的研究方向

（1）text2img方向，目前這個方向也在跟LLM結合，或者說LLM要具備多模態處理的能力；

（2）擴散模型（diffusion model），今年是被LLM蓋住了，本來最熱的研究方向是它；

（3）音訊/影片方向，類似text2img發展趨勢，利用text來自動生成音訊或者動畫影片，也是遊戲領域很在乎的一個方向；

以上個人看法，具體還的看個人的研究興趣+擁有的資源。最後推薦幾篇研究綜述，便於從中了解更多的研究方向和進展。

【1】Efficient Large Language Models: A Survey

【2】Data Management For Large Language Models: A Survey

【3】Large LanguageModelsMeet Computer Vision: A BriefSurvey

【4】Survey of Hallucination in Natural Language Generation

【5】 Large Language Models for Robotics: A Survey