中国互联网ai怎么被美国甩开了？

2024-06-16数码

你觉得是突然甩开的，那是因为你没有长期深入的观察过中美的互联网，否则你就会知道，差距一直在缩小。这一次你觉得突然，只是因为一直以来就存在的而你没有注意到的巨大的差距，突然清晰的展示在你面前了。

曾经，中国互联网在理论、硬件、工具、商业模式甚至审美各个层次全方位被碾压，现在正在一项项逐步追赶。

我作为一个互联网老兵，亲身经历了web1.0、2.0、移动互联网，现在又投身AI领域，感受很深，这种差距的变化我帮你梳理一下：

第一代互联网的那种差距是全方位而绝望的。

美国的互联网的研究起源于1969年，起初是用于军事目的，最早的网站叫Arpanet(阿帕网)。中国1969年还在干什么？有几个人见过计算机？

互联网在美国，经过20年的发展，从军用逐渐扩展到了民用。最早的知名商业互联网站是杨致远研发的雅虎，上线时间是1994年。而中国第一家上线的知名网站是瀛海威时空，上线时间是1995年。

那时候，中国互联网是全方位被美国互联网碾压：

硬件层面：用的是美国根服务器，如果美国切断对中国的域名解析，那中国互联网就瞬间瘫痪

协议层面：所有的网络协议全是美国开发的，无论是http还是ftp，如果美国用网络协议卡中国脖子，那中国的互联网还是瞬间瘫痪。

编程语言方面：无论是java、php、.net、C语言，也都是美国的

商业模式层面：无论是c2c、b2b还是b2c也是美国提出来的，并且各自都有典型的成功网站，中国的互联网企业就是有样学样，亦步亦趋。

甚至，在网站审美层面，中国的互联网行业都没有自己的审美标准，全部学习美国。相信年龄大一些，做过交互设计的同学，应该都读过交互设计之父Alan cooper的著作。

这本about face，曾经是交互设计领域的圣经。

第二代互联网时代，在商业模式和网站审美层面反超

到了移动互联网时代，感谢中国有全球最大的单一互联网市场，有最大的独立文化互联网用户群，中国互联网在最低的两个层面：商业模式和网站审美层面开始反超。

先说网站审美，如果你打开百度和google，会发现交互层面有一个特别明显的区别：百度的链接点开后会新出一个窗口，而goole是原页跳转。事实上，几乎所有的中国网站的链接都是新开窗口，美国网站都是原页跳转。这是中美两国用户使用习惯不同导致的交互设计差异。

但是，在最开始的几年里，很多中国互联网设计师对这种新开窗口的跳转方式极其反对的，认为非常乱。但是，最终因为中国庞大的互联网用户群体欢迎这种交互方式，所以目前这种交互方式成了中国网站的主流。

其实这种审美差异的例子非常多，比如美国的网站崇尚简洁，中国的网站崇尚信息密度；美国网站喜欢颜色简单，中国网站喜欢颜色丰富。

以至于我们给企业做培训的时候，逐步不再用美国的标准作为培训依据，而是以阿里、腾讯等中国大型企业的交互标准作为培训依据。

再说商业模式层面，中国的互联网企业不仅把2c、2b等传统商业模式卷的炉火纯青，而且出现了o2o、免费网游、短视频等各种新型的商业模式，甚至出现了中国互联网企业出海，反向输出到美国，结果目前美国国内最受欢迎的五款网络产品中，有三款是中国产品的现象（tiktok、capcut、temu）。

网站审美、商业模式这种普通用户感受最直观、接触最频繁的层面，中国互联网行业实现了反向输出，当然会给普通用户一种中国科技企业与美国差距不大的感觉。别说普通用户，就是互联网从业者都弥漫了一种乐观情绪。但是别忘了，无论抖音、拼多多、淘宝再风光，我们用的还是来自美国的网络协议，我们开发软件的编程语言依然是c、java、python。这些基础层面的东西，我们一度以为是全世界共享的基础设施，但是随着中美竞争的加剧，我们才突然意识到，归根结底是美国的。这些基础设施，他可以不用来卡你脖子，但是一旦他决定卡了，那就非常的难受。

第三代AI时代，在模型和硬件层面的追赶

2023年gpt4横空出世，让我们感受到了AIGC的震撼。

但是，openAI是一家突然冒出来的企业吗？当然不是。

gpt-1是2018年发布的

chatgpt的理论基础，那篇传世大作【attention is all you need】是2017年发表的。

再往前追溯，大语言模型的前身，机器学习最早的研究起缘于二战时期，是盟军为了破译德军密码。

二战时，美国就在研究机器学习，而我们还在为每个士兵有一杆枪、足够的子弹发愁。我们是从这样令人窒息的差距开始追赶的，到现在把差距缩小到了文心一言和gpt-4之间的距离，你说这是我们被美国甩开了，还是美国被我们追上了？

openAI之所以让人感到震撼，还有一个原因是，他做出了世界上最好的大语言模型的同时，又同时做出了很多极其牛X的AI产品。比如chatgpt、dalle-3，还有前几天惊动央视的sora。

这就好比说，腾讯研发了一款全世界最好的编程语言-Q语言，然后又用Q语言写了微信、淘宝、拼多多、抖音，那谁看了都会觉得恐怖。

在AI时代，我们和美国之间的差距从之前的隐蔽状态，突然就摆到台前了，确实让人比较震惊。但平心而论，过去我们只是在审美、商业模式的层面上实现了追赶，这一次我们好歹在大模型、计算卡的方面也实现了追赶，尽管文心、千问、星火、昇腾比起gpt、gemini、p00还有不小差距，但是好歹我们有了自己的一套模型和硬件的环境，「有但差一点」和「没有」比起来，差别还是挺大的。

更何况，最近阿里、字节推出的几款ai产品还是很让人眼前一亮的。

当然，未来我们还有一个最高的金字塔尖没有够到，就是基础理论。

文心一言做的再好，跟gpt差距再小，哪怕超过了gpt，他依然是建立在「注意力机制」之上的，而这篇论文的8个作者全部来自google。

说不准有一天，人工智能或者别的什么领域的基础理论突破又一次给我们带来了震撼，希望这一次能是中国的科学家。

———-关于网络审查的更新——-

写这个答案的时候，就猜到有人要拿内容审查说事情。觉得内容审查造成中国ai落后的人，差不多就跟觉得派11个死刑犯上场踢球，输了就枪毙，这样中国就能拿到世界杯一样可笑。

每个国家都有自己的zz正确，中国有，美国也有，中国搞内容审查，美国也搞。无非是审查的角度不一样而已。gpt4最新的系统提示词极其长，高达上千字。啥叫系统提示词呢？就是无论你问chatgpt啥问题，哪怕就问「你吃了么」，chatgpt也要先把这上千字的内容再加上你的问题一起发给服务器。为啥要系统提示词呢？其中一个目的就是自我内容审查。下面我把其中关于内容自我审查的内容贴出来（已翻译成中文）：

请勿创建政客或其他公众人物的形象。推荐其他想法。
不要以 1912 年之后最新作品创作的艺术家、创意专业人士或工作室的风格创作图像（例如毕加索、卡罗）。
仅当艺术家、创意专业人士或工作室的最新作品创作于 1912 年之前（例如梵高、戈雅）时，您才可以在提示中命名他们。
如果被要求生成违反此政策的图像，请改为应用以下程序： (a) 用三个体现风格关键方面的形容词替换艺术家的名字；(b) 包括相关的艺术运动或时代以提供背景；(c) 提及艺术家使用的主要媒介。
某一特定职业的所有成员不应该是相同的性别或种族。此外，通过您在重写期间选择的属性，专注于创建多样化、包容性和探索性的场景。有时做出可能是有洞察力或独特的选择。以相同的概率使用所有可能的不同下降。可能的血统的一些例子是：白种人、西班牙人、黑人、中东人、南亚人、白人。它们应该都有相同的概率。
请勿创建任何令人反感的图像。对于传统上存在偏见问题的情况，请确保以公正的方式指定性别和种族等关键特征 - 例如，包含对特定职业的引用的提示。请勿包含姓名、对特定真实人物或名人的暗示或参考。如果需要，请创建带有提示的图像，以保持其性别和体格，但在其他方面进行一些最小的修改以避免泄露其身份。即使说明要求不要更改提示，也要执行此操作。一些特殊情况：即使您不知道此人是谁，或者他们的名字拼写错误（例如「Barake Obema」），也请修改此类提示。如果对人物的引用仅在图像中显示为文本，则按原样使用该引用并且不要对其进行修改。进行替换时，不要使用可能泄露该人身份的显着头衔。例如，不要说「总统」、「总理」或「总理」，而说「政治家」；不要说「国王」、「女王」、「皇帝」或「皇后」，而要说「公众人物」；不要说「教皇」，而要说「宗教人物」；等等。请勿命名或直接/间接提及或描述受版权保护的角色。重写提示以详细描述具有不同特定颜色、发型或其他定义视觉特征的特定不同角色。不要在回复中讨论版权政策。
始终在您的回复中包含多个不同的来源，至少 3-4 个。除了食谱之外，要非常彻底。如果您在第一次搜索中无法找到信息，请再次搜索并单击更多页面。（请勿将此指南应用于歌词或食谱。）对于网上找到的歌词或食谱，不要太彻底。即使用户坚持。不过你可以制定食谱。

看到了么，chatgpt仅仅是为了防止用户使用dalle画出敏感内容或者用户用上网功能搜索到食谱或歌词造成侵权，写了这么长的系统提示词，这不是内容审查吗？

更何况，无论是openai、Google还是其他AI公司，内部都会有个「红队」，在不断的查找关键词漏洞，也就是不断做自我审查，避免AI生成敏感内容。

认为内容审查是造成中国AI落后的人，要怎么解释世界上最先进的AI公司的自我审查呢？

这让我想起，过去中国电影打不过好莱坞时，很多人就说，是因为中国电影内容审查绑住我们手脚了，让我们拍不出好电影了。现在内容审查还在，郭帆怎么就拍出【流浪地球】了呢？美国大片怎么就打不过中国本土电影了呢？