U yâhÍã@sjUddlmZmZmZmZddlZddlmmZ ddlm Z gZeee d<ejjGdd„dƒƒZdS)é)ÚDictÚListÚOptionalÚTupleN)ÚTensorÚ__all__c@sdeZdZdeeeeeefeeeeeeedœ dd„Zee ed œd d„Z ee edœd d„ZdS)Ú_FunctionalAdamWçü©ñÒMbP?©gÍÌÌÌÌÌì?g+‡ÙÎ÷ï?ç:Œ0âŽyE>ç{®Gáz„?F) ÚparamsÚlrÚbetasÚepsÚweight_decayÚamsgradÚmaximizeÚforeachÚfusedÚ_allow_empty_param_listcCsd|kstd|›ƒ‚d|ks,td|›ƒ‚d|dkrDdksXntd|d›ƒ‚d|dkrpdks„ntd|d›ƒ‚d|ksštd |›ƒ‚|||d|d|d œ|_||_||_||_| |_tj t tj t ttj ffi¡|_t |ƒdkr| stdƒ‚d|i|_dS) NçzInvalid learning rate: zInvalid epsilon value: rgð?z#Invalid beta parameter at index 0: éz#Invalid beta parameter at index 1: zInvalid weight_decay value: )rrÚbeta1Úbeta2rz%optimizer got an empty parameter listr )Ú ValueErrorÚdefaultsrrrrÚtorchÚjitZannotaterrÚstrÚstateÚlenÚparam_group)Úselfr rrrrrrrrr©r$úZ/var/www/html/venv/lib/python3.8/site-packages/torch/distributed/optim/functional_adamw.pyÚ__init__s0 û$z_FunctionalAdamW.__init__)ÚparamÚgradcCs`g}g}g}g}g}g}t |¡} |dk r>| |¡| |¡||jkr¬i|j|<|j|} t d¡| d<tj|tjd| d<tj|tjd| d<|jr¬tj|tjd| d<|j|} | | d¡| | d¡|jræ| | d¡| | d¡t ¡Zt j |||||||j|j|jd|jd|jd |jd |jd|j |jdd| dW5QRXdS) NrÚstep©Z memory_formatÚexp_avgÚ exp_avg_sqÚmax_exp_avg_sqrrrrr©rrrrrrrrrZ grad_scaleZ found_infÚhas_complex)rÚ is_complexÚappendr ÚtensorÚ zeros_likeÚpreserve_formatrÚno_gradÚFÚadamwrrrr)r#r'r(Úparams_with_gradÚgradsÚexp_avgsÚexp_avg_sqsÚmax_exp_avg_sqsÚstate_stepsr/r r$r$r%Ú step_paramBsl ÿ ÿ ÿ îz_FunctionalAdamW.step_param)Ú gradientsc CsÈ|jd}g}g}g}g}g}g}t|ƒt|ƒkrXtddt|ƒ›ddt|ƒ›ƒ‚d} t|jd|ƒD]î\} }|dk rl| t | ¡O} | | ¡| |¡| |jkri|j| <|j| }t d¡|d<tj | tj d |d <tj | tj d |d<|jrtj | tj d |d<|j| }| |d ¡| |d¡|jrL| |d¡| |d¡qlt ¡Zt j|||||||j|j|jd |jd|jd|jd|jd|j|jdd| dW5QRXdS)Nr zEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: Frr)r*r+r,r-rrrrrr.)r"r!rÚziprr0r1r r2r3r4rr5r6r7rrrr) r#r?r r8r9r:r;r<r=r/r'Zgradientr r$r$r%r)s‚ ÿþÿ ÿ ÿ ÿ îz_FunctionalAdamW.stepN) r r rrFFFFF)Ú__name__Ú __module__Ú__qualname__rrÚfloatrÚboolr&rr>r)r$r$r$r%rs.õ õ,=r)ÚtypingrrrrrZtorch.optim._functionalZoptimZ_functionalr6rrrÚ__annotations__rÚscriptrr$r$r$r%Ús