當前位置: 華文問答 > 遊戲

有哪些玩遊戲時能使用的高等數學知識?

2017-03-11遊戲

遊戲活動的輪換和英雄的周免計劃都可以用數學建模來最佳化,我們為此寫了一篇paper...

經常打網絡遊戲和刷抖音B站的夥伴們一定有過以下的經歷:在遊戲裏一個模式或者英雄玩得不亦樂乎時,突然就覺得玩膩了;抑或是在抖音和B站上,一類影片讓你欲罷不能,但看多了之後就審美疲勞了。過了一段時間,我們似乎又能重拾新鮮感,重新開始這樣的消費行為,並再次重復整個過程。短影片和遊戲雖有不同,但它們似乎都遵循了一個簡單的規律:總會膩。為了應對這種審美疲勞,遊戲公司和內容創作者們使出渾身解數來保持使用者的新鮮感:遊戲公司會巧妙地輪換已有的遊戲模式和英雄,讓玩家隔一段時間才能再次體驗;B站的網紅們也會變換花樣,比如音樂區美女up主偶爾獻上一波生活vlog;而擁有多個網紅的MCN公司,更新日程安排更是充滿「玄機」:以我喜歡的搞笑up主真子日記和甜蜜老張為例,他們都屬於13傳媒這家MCN公司。雖然這兩個賬號都在抖音上保持一個月更新6-7個影片,但兩人很少在同一天更新,就是為了確保粉絲每天都有新內容可看,又不至於讓人審美疲勞。那麽,你是否會好奇, 遊戲內的活動輪換和up主的更新日程究竟是如何確定的?這些決策是否能運用數學模型來定量決定呢?怎樣的日程安排才能最大化使用者的長期活躍度呢?

在最近的一篇paper中,我們對這類容易審美疲勞的內容進行了數學建模,並且研究了什麽樣的安排可以最大化使用者活躍。作為香港大學經管學院的助理教授,我的研究聚焦於最佳化平台與使用者的持續互動。大概幾年前,我曾在動視做過數據科學家實習,那時動視的招牌系列【使命召喚】就開始輪換不同的遊戲模式(學名叫playlist rotation),並且對如何最佳化輪換計劃非常關註。去年,我的好友、香港中文大學的王世欣找到我,告訴我她最近沈迷狼人殺,發現「板子」的輪換問題異常有趣。我們倆一拍即合,決定從科學的角度深入研究這個問題。

在文章中,我們用一個獨特的指標來量化個體對商品的膩味程度,稱之為「飽腹感」(satiation)。遊戲和短影片除了直接帶來飽腹感之外,還會對同類別商品產生間接的飽腹感。因此,在這些機制的影響下,商家需要設計一個能有效避開高飽腹感的活動輪換策略來吸引使用者的消費。我們對使用者的飽腹感進行了建模,研究了在多種情形下輪換策略的性質與最佳化。我們的分析考慮了很多現實中的問題:

對於能夠更新兩種影片的up主,究竟哪種影片應作為她的主業? 是成為一個音樂up主還是主攻vlog的顏值up主?針對這類網紅定位、產品定位的問題,我們發現答案有時出人意料:大家往往認為,偶爾更新的那個系列,應該是更令人印象深刻但也需要更多時間來消化疲勞的那個系列。然而,我們的研究發現,在兩個相關性較高的系列中,有時竟然應該把這類容易疲勞的影片作為日更系列。

對於擁有上百個英雄的遊戲以及擁有上千網紅的MCN公司來說,如何設計輪換策略? 面對這樣的大規模規劃問題,我們發現增加物品總數帶來的邊際收益會迅速降低,維持一個相對較小的輪換選單足以獲得絕大部份的營收。此外,當數量逐漸增加時,公司應該保持每周的英雄數量不變,轉而增加同一個英雄出現的間隔時長。

在接下來的文章裏,我們透過簡化版的模型來闡明這些問題,具體細節和更多的拓展可以檢視我們的paper。 如果你不想深入數學細節,也可以直接檢視加粗的結論部份。

使命召喚系列的遊戲模式輪換

模型簡介

在模型中,我們把一個遊戲模式或者英雄當成一種商品。同理,一個網紅up主的所有影片因為風格相似,也被我們當成一種商品。每種商品有三種參數:邊際效用 B ,營運成本 c ,以及飽腹感衰減參數 \gamma 。

在使用者視角,使用者擁有一個飽腹值 x 記錄當前時刻自己的飽腹程度,使用者會在每期選取商品攝入量 q (玩多少小時,看多久影片)。使用者會透過消費獲得效用。為了刻畫審美疲勞,我們假設使用者的效用是 U(x_t+q_t) - U(x_t) ,其中 U(z)=-\frac{1}{2}z^2+Bz . 也就是說,給定檔期的飽腹感 x ,使用者產生的效用是 -\frac{1}{2}q^2+(B-x)q . 當 x 越大時,使用者的效用就會越低。使用者會選擇效用最大化的消費量,透過求導,我們會得出使用者的消費量應該是 B-x . 同理,飽腹感越高,使用者的消費量就會越低。 在下一期中,使用者的飽腹感會變為:

x_{t+1} = \gamma (x_t+q_t) .

上述的消費,只有商家提供產品時才會發生。因此,商家的決策為,在每期決定是否提供商品。提供商品會有一定的收入,但是也會有營運成本 c ;如果不提供商品,商家不會獲得收入,但是也節約了營運成本。透過引入一個0-1變量 y_t 表示商家是否提供商品,我們把商家的決策問題寫為最大化長期的平均凈收益問題:

\max_{y_t}\lim_{t\to \infty} \sum_{t=1}^T y_t(q_t-c_t)/T

以上是商家只有一個產品的情況,例如王剛的做飯影片。在多物品情形中,每個物品有自己在每期的飽腹值,消費物品除了增加邊際效用外還會由相關性產生額外效用。當相關系數為正時,物品之間具有替代關系,一個物品消費的增多會間接減少另一個物品的消費;當相關系數為負時,物品具有互補關系,一個物品消費的增加會間接增加另一個物品的消費。

接下來我們用一個例子展示模型的計算過程:

假設某商家有一個商品,其參數為 B=10, c=3, \gamma=0.9 ,在提供商品的第一期,使用者的初始飽腹感為 x_1 = 0 ,使用者會消費 q_1 = \arg\max_q (-\frac{1}{2}q^2 + 10q) = 10 個單位的商品。經過一期的消費後飽腹值變為 x_2 = \gamma (x_1+q_1) = 0.9*10 = 9 。商家第一期的利潤為 q_1-c = 10-3 = 7 。

在第二期,假如商家仍選擇提供商品,那麽使用者會消費 q_2 = \arg\max_q (-\frac{1}{2}q_1^2 + (10 - 9)q) = 1 。使用者在第二期結束後的飽腹感為 x_3 = \gamma (x_2+q_2) = 9 , 商家的收入為 q_2 - c = 1 - 3 =-2 。可以看到由於使用者飽腹感較高,連續提供商品甚至會產生負收入的情況,因此商家可以考慮暫時不提供商品使自己能最大化長期平均收益。假如第二期商家不提供商品,那麽使用者的消費為 q_2 = 0 ,第二期結束時的飽腹感為 x_2 = 0.9 *(9 + 0) = 8.1 ,商家的利潤為0。

最優決策需要平衡周期長短帶來的兩方向影響因素:周期較短時,使用者的飽腹值更高,過於頻繁的提供商品會使每期平均收益會更低;周期較長時,當飽腹值較低且未提供商品時,商家會損失這部份的利潤。我們在研究中發現,商家的最優決策一定是周期性決策;並且對於單個商品,最優周期滿足

l^*= \arg\max_l (B(1-\gamma^l)-c) / l

這是一個先減後增的單峰函數,對應前面分析的兩個方向的作用。例如在上面的例子中,帶入參數可算得 l^*= 10 ,即每10期提供一次商品可以使長期平均凈收益最大化。 這個公式可以解釋不同up主為何更新頻率不同,有人每周更新一次,而有人每周三周六更新,還有人幾乎每天都更新。透過這個公式,每一個up主都可以找到自己最優的更新頻率。

利潤和更新間隔的關系

產品、網紅定位問題

假如有一個商家擁有兩個商品,他打算將一個商品作為常規商品每期都提供,另一個商品作為特殊商品,每K期內只在第一期時提供一次。如果兩個商品有些內容相似,商家該如果考慮並選擇常規和特殊商品?

在生活中這樣的例子隨處可見: 遊戲模式有日常模式與特殊模式,餐館有常規選單與特殊選單,影片制作者有常規影片與特典影片。決定哪一類商品是我們的常規商品,也就決定了自己的定位,因此這個問題我們叫做定位問題。假設我們是一位更新周期已經固定(例如每周一更)並且有兩類影片的up主,我們現在的決策即為選擇一類影片作為常規影片每期更新,另一類影片作為特別影片每幾期更新一次。例如,B站上有一位up主 鹹魚_栗,她的常規影片為架子鼓主題,除了架子鼓外偶爾會發顏值類vlog。那麽,這樣的定位對她來說是最優的嗎?是該做一個被架子鼓耽誤的顏值up主,還是做一個才華與美貌兼具的音樂區up主呢?

經營兩個系列的up主該如何定位?

為了刻畫兩個商品,我們假設兩個商品分別是a和b. 相對於只有一個商品的情況,我們還要考慮兩個物品的相關性。我們用d來表示兩個物品的相關系數,而使用者獲得的效用可以表示成 -\frac{1}{2}\left((q_a^t)^2+2d q_a^t q_b^t +(q_b^t)^2\right)+(B_a-x_a^t-dx_b^t)q_a^t+(B_b-x_b^t-dx_a^t)q_b^t.

假設兩個商品的營運成本 c 相等,一個商品的效用更高且更難以忘記,另一個商品效用更低但更容易被忘記;即 c_a=c_b, B_a>B_b,\gamma_a>\gamma_b 。這種情況下,哪個產品應該作為日常商品呢?直覺上,特殊商品往往效用更高更難忘(也就是a),而且它需要更多的時間來消化。但在我們的研究中發現,在兩個物品相關性較高時,應選取效用更低但更容易被忘記的商品作為特殊商品。即當 d > \frac{1-\gamma_b}{1-\gamma_a} 時,應選 b 作為特殊商品。

這背後的原因是,特殊商品除了在被供應的那一期會降低常規商品的消費(假設這一期為第1期),同時會影響常規商品在 t = 2,\dots ,K 的消費,我們稱該現象為"漣漪效應"。

假如產品b每4期供應一次,它在另外三期裏依然會對常規產品a的需求產生影響

漣漪效應的產生是因為,經過我們的一番計算,在t = 2,\dots ,K 期,日常商品的消費為

q_a^t=B_a\left(1-\gamma_a\right)+\frac{d}{\gamma_b^{K+2-t}}\left(\gamma_a-\gamma_b\right) x_b^1

在上面的運算式中,第一項為只有a物品時客戶在每期的消費量;第二項為引入了周期性商品b後,日常商品的消費受到的影響。當 \gamma_a<\gamma_b 時,第二項為正,那麽特殊商品的存在使得在 t = 2,\dots ,K 時日常商品的消費更低。這對應了生活當中,遊戲裏的輪換活動獎勵很高,肝的太多,導致活動結束後連普通模式都玩不動了。在這種情況下,雖然輪換活動可以增加活動期間的使用者活躍,但可能會抑制整體收益。反之,當 \gamma_a>\gamma_b 時,上式第二項為正,那麽特殊商品的存在使得在 t = 2,\dots ,K 時日常商品的消費更高。這對應了生活當中,輪換活動雖然沒有那麽一顆賽艇,但很不容易厭倦。所以當活動結束後,我還是意猶未盡,但因為沒得玩,我只能玩普通模式聊以充饑。因此,在考慮長期平均收益時,使用這樣的商品作為輪換產品可能會促進整體平均收益。

舉例來說,假如鹹魚_栗的兩類影片,a為顏值類vlog,b為架子鼓類影片。兩者的營運成本相同;架子鼓影片的效用高於顏值類vlog影片 , B_b > B_a ;架子鼓影片更讓人難忘, \gamma_b = 0.8>\gamma_a=0.6 ;如果兩類影片的相關系數為 d = 0.7 ,那麽因為 0.7 > \frac{1-0.8}{1-0.6}=0.5 ,她應該選擇顏值類vlog影片當作特殊影片。反之,如果 d<0.5 ,那麽她就應該以顏值vlog作為常規影片。 產品定位的決定不光在於產品本身的內容,也在於漣漪效應的方向!

英雄聯盟周免計劃

多個物品和固定個數的輪換策略

接下來,我們考慮某個擁有大量商品的商家,且商品之間具有一定的相關性。商家希望在一個周期內輪流展示完所有商品,並在下一輪周期中重復。由於商品繁多且周期很長,最優決策變得非常難以分析。為了對此類問題進行有效的分析,我們考慮該類問題的一種特殊情形:商品具有一定相似性或對稱性,並且每期商家展示等量的商品。此時商家的決策為:選定每次展示的商品個數,以及一個周期的周期長度。最後,他還需要決定一個周期內展示商品的順序。我們考慮商家有N個商品打算在K期內輪流提供,並且在每一期提供的商品數量為 v=N/k 。例如英雄聯盟目前含有N=165個英雄,每周提供v = 25個英雄作為周免英雄。使命召喚有大約30個遊戲模式,每周會提供5個模式作為輪轉。在這個問題裏,商家面臨這樣的困境:如果同一期提供很多的商品(v大),那麽輪轉周期就短,顧客雖然每一期有更多的選擇(進而產生更多的消費),但他們的飽腹感也缺少時間消化;如果每期提供的商品較少,那周期就長,這樣可以讓飽腹感充分消化,但每一期使用者的選擇就少了。在這種情況下,哪種輪換模式更有效呢?

我們首先考慮了當每類物品內容都相同的情況(即效用,相關性,成本,以及飽腹度衰減參數均相等)。我們發現, 對於商品比較多的商家,一個更小的輪換選單+更長的周期比一個更大的輪換選單+短周期更有效。 當商品個數趨近於無窮時,最優決策中的周期數線性增長,每次展出的商品個數收斂到 \frac{1-\gamma}{d}\left(\sqrt{\frac{B(1-d)}{c}}-(1-d)\right) . 例如,當 \gamma =0.4, d = 0.1, B = 1, c =0.3 時,隨著我們將N從1增加到50,下圖的紅色圓點表示了最優的輪換策略。在N從1增加到25的過程中,最優的K和v會由於整數效應而犬牙差互地增長。但是當N足夠大之後,最優的策略變為每期展示5個商品,線性增加周期長度。因此對於那些擁有許多商品的商家來說,更小的輪換數目和更長的周期能帶來更高的收益。

那麽如果這些物品的內容不完全相同呢?這種情況下,我們不光要考慮K和v,還要考慮物品的具體展示順序。我們發現了一個非常驚訝的結果:當所有物品的衰減系數 \gamma 相同時, 只要固定K和v,任何順序的輪換策略收益都一樣! 這個結果之所以很神奇,是因為當我們交換其中任何兩個物品的位置時,這兩個物品的消費量都會發生復雜的變化,因為這些物品的需求會受到其他所有物品的影響。然而,如果我們把整個周期的需求當作一個整體,就會驚奇地發現一個周期的總需求不會因為具體的順序而產生變化! 這個結果對於擁有眾多服務產品的公司是一個福音:公司只需要重視周期K這個一維決策,而具體的順序則沒那麽重要。

每天午餐選單的輪換,也是這個模型的套用之一

其他場景

那麽,對於其他的場景,遊戲公司該怎麽做呢?很多遊戲公司的活動和模式可能沒有那麽多,上面的結論並不適用。實際上,很多遊戲可能只有不到10種活動模式,實際的輪換也非常復雜(如下圖)。對於這些公司,他們該如何最佳化輪換日程呢?

遊戲中復雜的輪換機制

對於這些疑難雜癥,我們透過一系列變換,把輪換日程的設計轉化成了一個整數規劃問題,使得每一家公司都可以使用我們的模型,透過商業求解器進行最佳化。 想要了解具體該怎麽做?趕快點選下方連結檢視論文全文吧!

(本文由我們的學生合作者萬北宸負責初稿,如果對文章有任何反饋歡迎私信)