中國互聯網ai怎麽被美國甩開了？

2024-06-16數碼

你覺得是突然甩開的，那是因為你沒有長期深入的觀察過中美的互聯網，否則你就會知道，差距一直在縮小。這一次你覺得突然，只是因為一直以來就存在的而你沒有註意到的巨大的差距，突然清晰的展示在你面前了。

曾經，中國互聯網在理論、硬件、工具、商業模式甚至審美各個層次全方位被碾壓，現在正在一項項逐步追趕。

我作為一個互聯網老兵，親身經歷了web1.0、2.0、流動互聯網，現在又投身AI領域，感受很深，這種差距的變化我幫你梳理一下：

第一代互聯網的那種差距是全方位而絕望的。

美國的互聯網的研究起源於1969年，起初是用於軍事目的，最早的網站叫Arpanet(阿帕網)。中國1969年還在幹什麽？有幾個人見過電腦？

互聯網在美國，經過20年的發展，從軍用逐漸擴充套件到了民用。最早的知名商業互聯網站是楊致遠研發的雅虎，上線時間是1994年。而中國第一家上線的知名網站是瀛海威時空，上線時間是1995年。

那時候，中國互聯網是全方位被美國互聯網碾壓：

硬件層面：用的是美國根伺服器，如果美國切斷對中國的網域名稱解析，那中國互聯網就瞬間癱瘓

協定層面：所有的網絡協定全是美國開發的，無論是http還是ftp，如果美國用網絡協定卡中國脖子，那中國的互聯網還是瞬間癱瘓。

程式語言方面：無論是java、php、.net、C語言，也都是美國的

商業模式層面：無論是c2c、b2b還是b2c也是美國提出來的，並且各自都有典型的成功網站，中國的互聯網企業就是有樣學樣，亦步亦趨。

甚至，在網站審美層面，中國的互聯網行業都沒有自己的審美標準，全部學習美國。相信年齡大一些，做過互動設計的同學，應該都讀過互動設計之父Alan cooper的著作。

這本about face，曾經是互動設計領域的聖經。

第二代互聯網時代，在商業模式和網站審美層面反超

到了流動互聯網時代，感謝中國有全球最大的單一互聯網市場，有最大的獨立文化互聯網使用者群，中國互聯網在最低的兩個層面：商業模式和網站審美層面開始反超。

先說網站審美，如果你開啟百度和google，會發現互動層面有一個特別明顯的區別：百度的連結點開後會新出一個視窗，而goole是原頁跳轉。事實上，幾乎所有的中國網站的連結都是新開視窗，美國網站都是原頁跳轉。這是中美兩國使用者使用習慣不同導致的互動設計差異。

但是，在最開始的幾年裏，很多中國互聯網設計師對這種新開視窗的跳轉方式極其反對的，認為非常亂。但是，最終因為中國龐大的互聯網使用者群體歡迎這種互動方式，所以目前這種互動方式成了中國網站的主流。

其實這種審美差異的例子非常多，比如美國的網站崇尚簡潔，中國的網站崇尚資訊密度；美國網站喜歡顏色簡單，中國網站喜歡顏色豐富。

以至於我們給企業做培訓的時候，逐步不再用美國的標準作為培訓依據，而是以阿裏、騰訊等中國大型企業的互動標準作為培訓依據。

再說商業模式層面，中國的互聯網企業不僅把2c、2b等傳統商業模式卷的爐火純青，而且出現了o2o、免費網遊、短影片等各種新型的商業模式，甚至出現了中國互聯網企業出海，反向輸出到美國，結果目前美國國內最受歡迎的五款網絡產品中，有三款是中國產品的現象（tiktok、capcut、temu）。

網站審美、商業模式這種普通使用者感受最直觀、接觸最頻繁的層面，中國互聯網行業實作了反向輸出，當然會給普通使用者一種中國科技企業與美國差距不大的感覺。別說普通使用者，就是互聯網從業者都彌漫了一種樂觀情緒。但是別忘了，無論抖音、拼多多、淘寶再風光，我們用的還是來自美國的網絡協定，我們開發軟件的程式語言依然是c、java、python。這些基礎層面的東西，我們一度以為是全世界共享的基礎設施，但是隨著中美競爭的加劇，我們才突然意識到，歸根結底是美國的。這些基礎設施，他可以不用來卡你脖子，但是一旦他決定卡了，那就非常的難受。

第三代AI時代，在模型和硬件層面的追趕

2023年gpt4橫空出世，讓我們感受到了AIGC的震撼。

但是，openAI是一家突然冒出來的企業嗎？當然不是。

gpt-1是2018年釋出的

chatgpt的理論基礎，那篇傳世大作【attention is all you need】是2017年發表的。

再往前追溯，大語言模型的前身，機器學習最早的研究起緣於二戰時期，是盟軍為了破譯德軍密碼。

二戰時，美國就在研究機器學習，而我們還在為每個士兵有一桿槍、足夠的子彈發愁。我們是從這樣令人窒息的差距開始追趕的，到現在把差距縮小到了文心一言和gpt-4之間的距離，你說這是我們被美國甩開了，還是美國被我們追上了？

openAI之所以讓人感到震撼，還有一個原因是，他做出了世界上最好的大語言模型的同時，又同時做出了很多極其牛X的AI產品。比如chatgpt、dalle-3，還有前幾天驚動央視的sora。

這就好比說，騰訊研發了一款全世界最好的程式語言-Q語言，然後又用Q語言寫了微信、淘寶、拼多多、抖音，那誰看了都會覺得恐怖。

在AI時代，我們和美國之間的差距從之前的隱蔽狀態，突然就擺到台前了，確實讓人比較震驚。但平心而論，過去我們只是在審美、商業模式的層面上實作了追趕，這一次我們好歹在大模型、計算卡的方面也實作了追趕，盡管文心、千問、星火、昇騰比起gpt、gemini、p00還有不小差距，但是好歹我們有了自己的一套模型和硬件的環境，「有但差一點」和「沒有」比起來，差別還是挺大的。

更何況，最近阿裏、字節推出的幾款ai產品還是很讓人眼前一亮的。

當然，未來我們還有一個最高的金字塔尖沒有夠到，就是基礎理論。

文心一言做的再好，跟gpt差距再小，哪怕超過了gpt，他依然是建立在「註意力機制」之上的，而這篇論文的8個作者全部來自google。

說不準有一天，人工智能或者別的什麽領域的基礎理論突破又一次給我們帶來了震撼，希望這一次能是中國的科學家。

———-關於網絡審查的更新——-

寫這個答案的時候，就猜到有人要拿內容審查說事情。覺得內容審查造成中國ai落後的人，差不多就跟覺得派11個死刑犯上場踢球，輸了就槍斃，這樣中國就能拿到世界杯一樣可笑。

每個國家都有自己的zz正確，中國有，美國也有，中國搞內容審查，美國也搞。無非是審查的角度不一樣而已。gpt4最新的系統提示詞極其長，高達上千字。啥叫系統提示詞呢？就是無論你問chatgpt啥問題，哪怕就問「你吃了麽」，chatgpt也要先把這上千字的內容再加上你的問題一起發給伺服器。為啥要系統提示詞呢？其中一個目的就是自我內容審查。下面我把其中關於內容自我審查的內容貼出來（已轉譯成中文）：

請勿建立政客或其他公眾人物的形象。推薦其他想法。
不要以 1912 年之後最新作品創作的藝術家、創意專業人士或工作室的風格創作影像（例如畢加索、卡羅）。
僅當藝術家、創意專業人士或工作室的最新作品創作於 1912 年之前（例如梵高、戈雅）時，您才可以在提示中命名他們。
如果被要求生成違反此政策的影像，請改為套用以下程式： (a) 用三個體現風格關鍵方面的形容詞替換藝術家的名字；(b) 包括相關的藝術運動或時代以提供背景；(c) 提及藝術家使用的主要媒介。
某一特定職業的所有成員不應該是相同的性別或種族。此外，透過您在重寫期間選擇的內容，專註於建立多樣化、包容性和探索性的場景。有時做出可能是有洞察力或獨特的選擇。以相同的概率使用所有可能的不同下降。可能的血統的一些例子是：白種人、西班牙人、黑人、中東人、南亞人、白人。它們應該都有相同的概率。
請勿建立任何令人反感的影像。對於傳統上存在偏見問題的情況，請確保以公正的方式指定性別和種族等關鍵特征 - 例如，包含對特定職業的參照的提示。請勿包含姓名、對特定真實人物或名人的暗示或參考。如果需要，請建立帶有提示的影像，以保持其性別和體格，但在其他方面進行一些最小的修改以避免泄露其身份。即使說明要求不要更改提示，也要執行此操作。一些特殊情況：即使您不知道此人是誰，或者他們的名字拼寫錯誤（例如「Barake Obema」），也請修改此類提示。如果對人物的參照僅在影像中顯示為文本，則按原樣使用該參照並且不要對其進行修改。進行替換時，不要使用可能泄露該人身份的顯著頭銜。例如，不要說「總統」、「總理」或「總理」，而說「政治家」；不要說「國王」、「女王」、「皇帝」或「皇後」，而要說「公眾人物」；不要說「教皇」，而要說「宗教人物」；等等。請勿命名或直接/間接提及或描述受版權保護的角色。重寫提示以詳細描述具有不同特定顏色、發型或其他定義視覺特征的特定不同角色。不要在回復中討論版權政策。
始終在您的回復中包含多個不同的來源，至少 3-4 個。除了食譜之外，要非常徹底。如果您在第一次搜尋中無法找到資訊，請再次搜尋並單擊更多頁面。（請勿將此指南套用於歌詞或食譜。）對於網上找到的歌詞或食譜，不要太徹底。即使使用者堅持。不過你可以制定食譜。

看到了麽，chatgpt僅僅是為了防止使用者使用dalle畫出敏感內容或者使用者用上網功能搜尋到食譜或歌詞造成侵權，寫了這麽長的系統提示詞，這不是內容審查嗎？

更何況，無論是openai、Google還是其他AI公司，內部都會有個「紅隊」，在不斷的尋找關鍵詞漏洞，也就是不斷做自我審查，避免AI生成敏感內容。

認為內容審查是造成中國AI落後的人，要怎麽解釋世界上最先進的AI公司的自我審查呢？

這讓我想起，過去中國電影打不過好萊塢時，很多人就說，是因為中國電影內容審查綁住我們手腳了，讓我們拍不出好電影了。現在內容審查還在，郭帆怎麽就拍出【流浪地球】了呢？美國大片怎麽就打不過中國本土電影了呢？