當前位置: 華文問答 > 科學

如何理解矩陣對矩陣求導?

2020-04-30科學

大家的回答多少有些復雜。這裏,我試圖用一個簡單的例項來解釋。

首先,矩陣對矩陣求導數,也稱為矩陣的微分,是一種將一個矩陣作為函式,對另一個矩陣進行求導的操作。要理解矩陣對矩陣求導數,首先需要了解導數的概念。在單變量函式中,導數表示函式在某一點的變化率。類似地,在矩陣對矩陣求導數中,我們研究的是矩陣函式在某一點的變化率。

設有一個函式f(A),其中A是一個矩陣,而f(A)的輸出也是一個矩陣。我們希望計算f(A)對A的導數。這意味著我們要計算當A發生微小變化時,f(A)如何變化。

矩陣對矩陣求導數的結果是一個二維陣列( 為方便行文和碼字, 我們這裏把矩陣都reshape成向量 ),被稱為亞可比矩陣或梯度矩陣。 亞可比矩陣的第i行第j列元素表示f(A)的第i個輸出對A的第j個輸入的偏導數。i的範圍是輸出矩陣的元素個數, j的範圍是輸入矩陣A得元素個數.

下面以一個簡單的範例來說明矩陣對矩陣求導數的計算過程。假設我們有一個函式f(A) = A^2,其中A是一個2x2的矩陣:

A = [[a, b], [c, d]]

我們的目標是計算f(A)對A的導數,即∂f(A)/∂A。

首先,我們計算A的平方:

A^2 = [[a^2 + bc, ab + bd], [ac + cd, bc + d^2]]

然後,我們對A的每個元素分別求偏導數,以計算亞可比矩陣。對於f(A)的第一個輸出對A的第一個輸入a的偏導數,我們可以得到:

∂f(A)_11/∂a = 2a

同樣地,我們計算f(A)對A的其他元素的偏導數。最終,我們得到亞可比矩陣:

∂f(A)/∂A = [[2a, b, c, 0], [0, a, 0, b], [0, c, 2d, a], [d, 0, b, 2d]]

這個亞可比矩陣表示了函式f(A) = A^2對輸入矩陣A的導數。它是一個4x4的矩陣,其中的每個元素都是關於輸入矩陣A的偏導數。

如果你看懂了,雙擊螢幕,知乎會把知識分享出去~

我是 @黃河邊兒 關註我, 一起交流日常科研, 學習生活.

推薦一本矩陣運算的書: