Aprendizaje por Refuerzo, algoritmo Sarsa aplicado a un problema de Ajedrez

Éste es un articulo escrito en en el año 2013 como sustentación del proyecto final de la asignatura de Inteligencia Artificial.

La inteligencia artificial junto con la computación han desarrollado un campo de diversas aplicaciones en las que las teorías de estas ciencias son aplicadas. El aprendizaje por refuerzo constituye una teoría completa de como aprender a decidir, ante una situación determinada, qué acción es la más adecuada para lograr un objetivo. Algunas aplicaciones de la teoría de aprendizaje por refuerzo se ven actualmente en áreas como Robótica, Neurociencia o Psicología. En este artículo se muestra una aplicación de la teoría de aprendizaje por refuerzo aplicado a los juegos, en este caso una final de ajedrez, se muestra los algoritmos que conforman el proceso para aprender, su funcionamiento y aplicación al problema de la final de ajedrez.

EL código fuente lo encuentras en GitHub.

El articulo completo lo puedes descargar aqui