職場小聰明_第592章 積極反饋的老師Relu函數(2)

作者:翟曉鷹·8個月前

ReLU 只需要簡單地判斷**“是否大於 0”**,不像 Sigid 或 Tanh 需要複雜的指數運算,因此它能讓神經網路計算得更快。

2. 解決梯度消失問題

在深度神經網路中,傳統的 Sigid 函式容易讓梯度變得越來越小(導致網路學不會東西)。但 ReLU 由於保持正值不變(直接 y=x),不會導致梯度消失,從而讓神經網路可以學習更復雜的模式。

3. 讓神經網路更容易訓練深層結構

ReLU 是現代深度學習的核心啟用函式,因為它讓深度神經網路(DNN、CNN、Transforr 等)可以穩定地訓練數百層,甚至更深。

ReLU 的缺點:可能會忽略一些“負面資訊”

雖然 ReLU 能夠高效理正數輸,但它也有一個潛在的問題——如果輸是負數,它就會直接變 0,不再參與計算,這可能會導致一部分神經元“死亡”,無法再學習任何東西。這個現象被稱為**“神經元死亡”問題**。

解決方案:ReLU 的改進版本

ULeR

ULeRULeRykaeL

x10.0?

?

ULeRPULeRcirtaraP

10.0ULeRykaeL?

調?

ULE

使?

?

IAULeR

ULeR

?

IA?

ULeR

ULeR

IAULEULeRPULeRykaeL?

ULeR

?

?

ULeRykaeLULeRIA

猜你喜歡

同題材或同分類的其他作品,僅供參考。