Logo tl.boatexistence.com

Bakit stochastic gradient descent?

Talaan ng mga Nilalaman:

Bakit stochastic gradient descent?
Bakit stochastic gradient descent?
Anonim

Ayon sa isang senior data scientist, isa sa mga natatanging bentahe ng paggamit ng Stochastic Gradient Descent ay ang nagagawa nito ang mga kalkulasyon nang mas mabilis kaysa sa gradient descent at batch gradient descent … Gayundin, sa napakalaking dataset, ang stochastic gradient descent ay maaaring mag-converge nang mas mabilis dahil mas madalas itong nagsasagawa ng mga update.

Para saan ang Stochastic Gradient Descent?

Ang

Ang Stochastic gradient descent ay isang algorithm sa pag-optimize na kadalasang ginagamit sa mga application ng machine learning upang mahanap ang mga parameter ng modelo na tumutugma sa pinakaangkop sa pagitan ng hinulaang at aktwal na mga output Ito ay isang hindi eksakto ngunit mahusay na diskarte. Ang stochastic gradient descent ay malawakang ginagamit sa mga application ng machine learning.

Bakit kailangan nating gumamit ng Stochastic Gradient Descent kaysa sa karaniwang gradient descent para sanayin ang isang convolutional neural network?

Stochastic gradient descent ini-update ang mga parameter para sa bawat obserbasyon na humahantong sa mas maraming update. Kaya ito ay isang mas mabilis na diskarte na tumutulong sa mas mabilis na paggawa ng desisyon. Ang mas mabilis na pag-update sa iba't ibang direksyon ay mapapansin sa animation na ito.

Bakit mas gusto natin ang gradient descent?

Ang pangunahing dahilan kung bakit ginagamit ang gradient descent para sa linear regression ay ang computational complexity: mas mura (mas mabilis) sa computation ang paghahanap ng solusyon gamit ang gradient descent sa ilang mga kaso. Dito, kailangan mong kalkulahin ang matrix X′X pagkatapos ay baligtarin ito (tingnan ang tala sa ibaba). Ito ay isang mamahaling kalkulasyon.

Bakit ginagamit ang SGD?

Ang

Stochastic gradient descent (madalas na dinaglat na SGD) ay isang umuulit na paraan para sa pag-optimize ng layunin na function na may naaangkop na smoothness properties (hal. differentiable o subdifferentiable).

Inirerekumendang: