Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
__init__.py		__init__.py
adamw.py		adamw.py
adamw_electra.py		adamw_electra.py
super_optimizer.py		super_optimizer.py
utils.py		utils.py

README.md

Optimizers

Optimizers manage weight update starting from gradient values. They may have complex internal states to better move on the loss multi-dimensional surface. Please use the fixed signature __init__(hyperparameters: Namespace, named_parameters: Generator) -> None for all the subclasses.

ElectraAdamW

This optimizer is same as AdamW but for a small fix to the moving average update mechanism. Original implementation can be found here.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

optimizers

optimizers

README.md

Optimizers

ElectraAdamW

Files

optimizers

Directory actions

More options

Directory actions

More options

Latest commit

History

optimizers

Folders and files

parent directory

README.md

Optimizers

ElectraAdamW