当前位置: 华文问答 > 数码

在 2024 年,我们可能会看到哪些新的人工智能领域突破?

2023-11-30数码

自动驾驶基座模型

自动驾驶的GPT模式大规模预训练方法。自动驾驶最大的痛点:数据需求量太大,标注成本太高。如果能像GPT那样先通过大规模无监督预训练获得智能,然后标注少量数据微调,那该多好啊!这个东西有时候叫World Model ,有时候叫Foundation Model,比较杂。但总归是这么个意思,就是复制ChatGPT的成功。

现在的状态:

仍然不令人满意,主要是数据太少,像样的车企都是几百上千万的视频,公开数据集的数据根本没法看。缺乏数据,训练这样的模型只能大概看个样子。其次预训练任务也可以再改改,学一下伯克利LVM的做法。

但真正的突破应该不会来自科研机构,只会来自掌握数据的车企,或者谁来创建个大数据集引领一下。我仍然相信特斯拉,现在这个方向基本等于明盘了,堆数据堆算力即可。

有LLM参与的自动驾驶

参与方式很多,现在是各方向全面开花的状态。现在的状态:

这个框架,可以说非常完美了。之前我还对那个memory module颇有微词,觉得这属于作弊。现在我已经改变看法了,记忆模块没有任何问题,人不也是靠记忆开车?到了某个场景,人会回忆老师教过的一套行为模式操作。杨乐昆的世界模型里也有记忆模块,如果记忆模块能解决问题,那就记吧!

要真正跑起来,还需要去nuPlan之类的数据集上测,然后把LLM小型化。明年应该可以!

基于NeRF的自动驾驶闭环仿真

通向自动驾驶的最后一公里:闭环仿真。用于训练RL是必须的,前面某回答里我说强化学习最大瓶颈就是仿真器,只要能仿真,强化学习一定秒杀人类。而使用游戏引擎渲染场景则面临人工建模太贵,虚拟和现实有gap等问题,已经是死路一条。NeRF是出路,现在的状态:

看起来挺厉害,但NeRF仍然存在无法撬动现实世界常识的问题。有没有所谓大规模预训练的NeRF?能让NeRF有一些先验的常识,哪怕他产生幻觉,也不至于想象出一些不符合常理的shi…

所以要解决闭环仿真问题一定要有一个比较好的NeRF,现在最好的NeRF也很一般,明年这方面应该会有大突破!