Logo
Uniopèdia
Comunicació
Disponible a Google Play
Nou! Descarregar Uniopèdia al dispositiu Android™!
Gratis
Accés més ràpid que el navegador!
 

Assaig i error і Sense model (aprenentatge de reforç)

Accessos directes: Diferències, Similituds, Similitud de Jaccard Coeficient, Referències.

Diferència entre Assaig i error і Sense model (aprenentatge de reforç)

Assaig i error vs. Sense model (aprenentatge de reforç)

El mètode d'assaig i error, també conegut com a prova i error, és un mètode per a l'obtenció de coneixement, tant proposicional com procedimental. En l'aprenentatge per reforç (RL), un algorisme sense model (a diferència d'un basat en models) és un algorisme que no estima la distribució de probabilitat de transició (i la funció de recompensa) associada al procés de decisió de Markov (MDP), que, en RL, representa el problema a resoldre.

Similituds entre Assaig i error і Sense model (aprenentatge de reforç)

Assaig i error і Sense model (aprenentatge de reforç) tenen 0 coses en comú (en Uniopèdia).

La llista anterior respon a les següents preguntes

Comparació entre Assaig i error і Sense model (aprenentatge de reforç)

Assaig i error té 12 relacions, mentre que Sense model (aprenentatge de reforç) té 5. Com que tenen en comú 0, l'índex de Jaccard és 0.00% = 0 / (12 + 5).

Referències

En aquest article es mostra la relació entre Assaig i error і Sense model (aprenentatge de reforç). Per accedir a cada article de la qual es va extreure la informació, si us plau visiteu:

Hey! Estem a Facebook ara! »