U yâhã@sfUddlmZmZmZddlZddlmmZddlm Z gZ eeed<ej jGdd„dƒƒZdS)é)ÚDictÚListÚOptionalN)ÚTensorÚ__all__c@s\eZdZdeeeeeeeeeeedœ dd„Zeeedœdd „Z eeed œdd„Z d S)Ú_FunctionalSGDç{®Gáz„?çF) ÚparamsÚlrÚmomentumÚ dampeningÚweight_decayÚnesterovÚmaximizeÚforeachÚfusedÚ_allow_empty_param_listcCsr||||dœ|_||_||_||_| |_tj ttj tt tj ffi¡|_t|ƒdkrd| sdt dƒ‚d|i|_dS)N)rrr rrz%optimizer got an empty parameter listr )ÚdefaultsrrrrÚtorchÚjitZannotaterrÚstrÚstateÚlenÚ ValueErrorÚparam_group)Úselfr rrr rrrrrr©rúX/var/www/html/venv/lib/python3.8/site-packages/torch/distributed/optim/functional_sgd.pyÚ__init__sü$z_FunctionalSGD.__init__)ÚparamÚgradc Csþ|jd}|jd}|jd}|jd}|g}g}g} d} |dk r–| |¡|jrVd} ||jkrji|j|<|j|}d|krˆ| d¡n| |d¡t ¡4tj|| ||||||j|j | |j |jddd W5QRX|j|}|d }|dk rú||d<dS)z[Similar to self.step, but operates on a single parameter and its gradient. rrr rFNTÚmomentum_buffer©rrrr rrÚhas_sparse_gradrrZ grad_scaleZ found_infr)rÚappendÚ is_sparserrÚno_gradÚFÚsgdrrrr) rr r!rrr rr Úmomentum_buffer_listÚgradsr$rr"rrrÚ step_param6sN ò z_FunctionalSGD.step_param)Ú gradientscCsp|jd}g}g}g}|jd}|jd}|jd}|jd} t|ƒt|ƒkrttddt|ƒ›dd t|ƒ›ƒ‚d } t||ƒD]n\}}|dk r‚| |¡| |¡|jr°d} ||jkrÄi|j|<|j|} d| krâ| d¡q‚| | d¡q‚t ¡4t j||||||| |j|j | |j|jddd W5QRXt|ƒD].\}}|j|} ||}|dk r<|| d<qs