Source code for lagom.envs.wrappers.scale_reward

from gym import RewardWrapper


[docs]class ScaleReward(RewardWrapper):
    r"""Scale the reward. 
    
    .. note::
    
        This is incredibly important and drastically impact on performance e.g. PPO. 
        
    Example::
    
        >>> from lagom.envs import make_gym_env
        >>> env = make_gym_env(env_id='CartPole-v1', seed=0)
        >>> env = ScaleReward(env, scale=0.1)
        >>> env.reset()
        >>> observation, reward, done, info = env.step(env.action_space.sample())
        >>> reward
        0.1
        
    Args:
            env (Env): environment
            scale (float): reward scaling factor
        
    """
    def __init__(self, env, scale=0.01):
        super().__init__(env)
        self.scale = scale
        
    def reward(self, reward):
        return self.scale*reward