U yâhã@sjUddlmZmZmZmZddlZddlmmZ ddlm Z gZeee d<ejjGdd„dƒƒZdS)é)ÚDictÚListÚOptionalÚTupleN)ÚTensorÚ__all__c @sLeZdZd eeeeeefeeeeedœdd„Zee ed œd d„Z dS)Ú_FunctionalAdamaxçü©ñÒMbP?©gÍÌÌÌÌÌì?g+‡ÙÎ÷ï?ç:Œ0âŽyE>çF)ÚparamsÚlrÚbetasÚepsÚweight_decayÚforeachÚmaximizeÚ_allow_empty_param_listc Cs d|kstd|›ƒ‚d|ks,td|›ƒ‚d|dkrDdksXntd|d›ƒ‚d|dkrpdks„ntd|d›ƒ‚d|ksštd |›ƒ‚|||d|d|d œ|_||_||_tj ttjtt tjffi¡|_ t|ƒdkrü|sütdƒ‚d|i|_dS) NrzInvalid learning rate: zInvalid epsilon value: rgð?z#Invalid beta parameter at index 0: éz#Invalid beta parameter at index 1: zInvalid weight_decay value: )rrÚbeta1Úbeta2rz%optimizer got an empty parameter listr ) Ú ValueErrorÚdefaultsrrÚtorchÚjitZannotaterrÚstrÚstateÚlenÚparam_group) Úselfr rrrrrrr©r!ú[/var/www/html/venv/lib/python3.8/site-packages/torch/distributed/optim/functional_adamax.pyÚ__init__s,û$z_FunctionalAdamax.__init__)Ú gradientscCs‚|jd}g}g}g}g}g}t|ƒt|ƒkrTtddt|ƒ›ddt|ƒ›ƒ‚d}t|jd|ƒD]º\} } | dk rh|t | ¡O}| | ¡| | ¡| |jkrîi|j| <|j| }t d¡|d<tj | tj d |d <tj | tj d |d<|j| }| |d ¡| |d¡| |d¡qht ¡Ltj ||||||jd|jd |jd|jd|jd|j|j|d W5QRXdS)Nr zEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: FrÚstep)Z memory_formatZexp_avgZexp_infrrrrr)rrrrrrrÚhas_complex)rrrÚziprZ is_complexÚappendrZtensorZ zeros_likeZpreserve_formatZno_gradÚFZadamaxrrr)r r$r Zparams_with_gradZgradsZexp_avgsZexp_infsZstate_stepsr&ÚparamZgradientrr!r!r"r%>sh ÿþÿ ÿ ÿ óz_FunctionalAdamax.stepN)r r rrFFF)Ú__name__Ú __module__Ú__qualname__rrÚfloatrÚboolr#rr%r!r!r!r"rs$÷ ÷(r)ÚtypingrrrrrZtorch.optim._functionalZoptimZ_functionalr)rrrÚ__annotations__rÚscriptrr!r!r!r"Ús