الرئيسيةعريقبحث

تعلم الفرق الزمني


تعلم الفرق الزمني أو التعلم من الفارق الزمني (Temporal difference learning)‏ هو قسمٌ من طرق التعلم بالتعزيز حرة النموذج، تتعلم بواسطة الانطلاق

  1. Richard Sutton & Andrew Barto (1998). Reinforcement Learning. MIT Press.  . مؤرشف من الأصل في 30 مارس 2017.
  2. Richard Sutton (1988). "Learning to predict by the methods of temporal differences". Machine Learning. 3 (1): 9–44. doi:10.1007/BF00115009. (A revised version is available on Richard Sutton's publication page - تصفح: نسخة محفوظة 2017-03-30 على موقع واي باك مشين.)
  3. Schultz, W, Dayan, P & Montague, PR. (1997). "A neural substrate of prediction and reward". Science. 275 (5306): 1593–1599. CiteSeerX . doi:10.1126/science.275.5306.1593. PMID 9054347.
  4. Montague, P. R.; Dayan, P.; Sejnowski, T. J. (1996-03-01). "A framework for mesencephalic dopamine systems based on predictive Hebbian learning" ( كتاب إلكتروني PDF ). The Journal of Neuroscience. 16 (5): 1936–1947. doi:10.1523/JNEUROSCI.16-05-01936.1996. ISSN 0270-6474. PMID 8774460. مؤرشف من الأصل ( كتاب إلكتروني PDF ) في 21 يوليو 2018.
  5. Montague, P.R.; Dayan, P.; Nowlan, S.J.; Pouget, A.; Sejnowski, T.J. (1993). "Using aperiodic reinforcement for directed self-organization" ( كتاب إلكتروني PDF ). Advances in Neural Information Processing Systems. 5: 969–976. مؤرشف من الأصل ( كتاب إلكتروني PDF ) في 12 مارس 2006.
  6. Montague, P. R.; Sejnowski, T. J. (1994). "The predictive brain: temporal coincidence and temporal order in synaptic learning mechanisms". Learning & Memory. 1 (1): 1–33. ISSN 1072-0502. PMID 10467583.
  7. Sejnowski, T.J.; Dayan, P.; Montague, P.R. (1995). "Predictive hebbian learning". Proceedings of Eighth ACM Conference on Computational Learning Theory: 15–18. doi:10.1145/230000/225300/p15-sejnowski (غير نشط 2019-08-20). مؤرشف من الأصل ( كتاب إلكتروني PDF ) في 13 أبريل 2020.

موسوعات ذات صلة :