当前位置: 华文问答 > 数码

一年百模大战下来,有哪些技术趋势和行业真相逐渐浮出水面?

2023-11-30数码

这个问题问得很好。这一年虽然AIGC行业新闻不断、热点频出,百模大战,几乎把中国古代的聪明人和神兽的名字都用光了。

年中资本市场上各种AI股票翻倍地涨(到下半年又都逐步回吐涨幅),年底OpenAI还来了一场震惊全球的「逼宫大戏」,可谓热闹是足了,但是也最终呈现出了一些华丽之下的真相,既有技术上的,也有商业上的:

  1. 国内大部分模型都是拿国外开源模型套壳,还美其名曰开发「垂直模型」。 本质上就是下载好预训练的开源模型,然后用自己的一些行业数据、私域数据进行微调,甚至直接拿来什么也不改的,脸不红心不跳地说自己自主研发、自主可控的大模型。反正,神经网络是个「黑盒子」,你有没法拆开看到底是哪里来的,不像芯片还能打磨一下看到里面的logo。
  2. 当然,国内现在也有一些自研的大模型,特别是大厂开发的,而且要看参数,那绝对是「遥遥领先」,你7B,我就20B,你147B,我就来个万亿,总之卷数据,没有谁可以卷得过国内企业的。至于说性能,考试那更是我们擅长的。结果就是,看着评分,很多国产大模型已经超过了GPT3.5甚至GPT4,但是一用起来,马上感觉完全不是那么回事。为啥呢? 很简单,因为这是开卷考试,我根据你的考题优化就行了。 目前国内的所有模型里面,我实际使用下来,「智谱清言」(ChatGLM)是开源、闭源中效果最好的,特别是跟工程、技术相关的内容,相当准确。
  1. 经过前期的喧嚣之后,大部分的初创应用都已经难以为继。 如上所述,真正在模型层面有所研发和突破的,很少。那么大部分就是一些包壳的工具(面向C端),还有一些针对特定行业的、经过微调的模型,但是随着大模型本身越来越强大,还有大模型普遍存在的「幻觉」问题(面向B端),使得企业对于对内或者对外使用AIGC,感觉非常慎重。
  1. 但是,的确也逐渐沉淀出了一些有实际效果,也得到用户认可的应用:
    1. 在文字处理领域,WPS、Flowus、飞书,都学习Notion、Office365的模式,开始为收费用户提供一定的AI辅助写作功能,也的确很多人感受到了其中的便利。但是实际比较下来,感觉还是有一定的差距,需要慎重使用。
    2. 在图像处理方面,因为国内直接使用Midjourney不方便(Discord用不了),所以各种用Stable Diffusion模型训练的工具很多,其中也跑出来了几个知名的。
    3. 在辅助办公方面,一个重要的方式是用大纲、文字描述,直接生成PPT,这里面迭代比较快的是Mindshow和AIPPT。