Class PGAgent

Policy gradient agent

Index

Constructors

Properties

_history _table

Methods

get_action get_score reset update

Constructors

constructor

new PGAgent(env: RLEnvironmentBase, resolution?: number): PGAgent
Parameters
- env: RLEnvironmentBase
  Environment
- Optionalresolution: number
  Resolution
Returns PGAgent
- Defined in lib/model/policy_gradient.d.ts:9

Properties

_history

_history: any[]

_table

_table: SoftmaxPolicyGradient

Methods

get_action

get_action(state: any[]): any[]
Returns a action.
Parameters
- state: any[]
  Current states
Returns any[]
Action
- Defined in lib/model/policy_gradient.d.ts:26

get_score

get_score(): number[][][]
Returns a score.

Returns number[][][]
Score values
- Defined in lib/model/policy_gradient.d.ts:20

reset

reset(): void
Reset agent.

Returns void
- Defined in lib/model/policy_gradient.d.ts:15

update

update(
    action: any[],
    state: any[],
    reward: number,
    done: boolean,
    learning_rate: number,
): void
Update model.
Parameters
- action: any[]
  Action
- state: any[]
  Next states
- reward: number
  Reward
- done: boolean
  Done epoch or not
- learning_rate: number
  Learning rate
Returns void
- Defined in lib/model/policy_gradient.d.ts:35