Deep Learning - Reinforcement Learning Part 5

45 - Deep Learning - Reinforcement Learning Part 5/ClipID:17721 vorhergehender Clip nächster Clip

Geschützte Daten

Zugriff/Freigabe nur für Mitglieder der FAU. Bitte klicken Sie hier für die Anmeldung

Schlüsselworte: deep Q learning AlphaGo convolution artificial intelligence deep learning machine learning reinforcement learning

Aufnahme Datum 2020-06-14

Sprache

Englisch

Einrichtung

Lehrstuhl für Informatik 5 (Mustererkennung)

Produzent

Lehrstuhl für Informatik 5 (Mustererkennung)

Format

Screencapture

Typ

universitäre Vorlesung

Deep Learning - Reinforcement Learning Part 5

In the last video on reinforcement learning, we look into the deep reinforcement learning techniques. We start looking into how Deep Mind beat Atari Games and in particular breakout. Furthermore, we look into the technology behind AlphaGo and AlphaGoZero to play Go, Chess, and Shogi on world-class level.

Links
Link to Sutton's Reinforcement Learning in its 2018 draft, including Deep Q learning and Alpha Go details

Video References:
Breakout Example 1
Breakout Example 2
AlphaGo Lee Sedol Match 3
AlphaGo Lee Sedol Match 4

Further Reading:
A gentle Introduction to Deep Learning

References
[1] David Silver, Aja Huang, Chris J Maddison, et al. “Mastering the game of Go with deep neural networks and tree search”. In: Nature 529.7587 (2016), pp. 484–489.
[2] David Silver, Julian Schrittwieser, Karen Simonyan, et al. “Mastering the game of go without human knowledge”. In: Nature 550.7676 (2017), p. 354.
[3] David Silver, Thomas Hubert, Julian Schrittwieser, et al. “Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm”. In: arXiv preprint arXiv:1712.01815 (2017).
[4] Volodymyr Mnih, Koray Kavukcuoglu, David Silver, et al. “Human-level control through deep reinforcement learning”. In: Nature 518.7540 (2015), pp. 529–533.
[5] Martin Müller. “Computer Go”. In: Artificial Intelligence 134.1 (2002), pp. 145–179.
[6] Richard S. Sutton and Andrew G. Barto. Introduction to Reinforcement Learning. 1st. Cambridge, MA, USA: MIT Press, 1998.

Nächstes Video

46 - Deep Learning - Unsupervised Learning Part 1

Prof. Dr. Andreas Maier

2020-06-18

IdM-Anmeldung

47 - Deep Learning - Unsupervised Learning Part 2

Prof. Dr. Andreas Maier

2020-06-19

IdM-Anmeldung

48 - Deep Learning - Unsupervised Learning Part 3

Prof. Dr. Andreas Maier

2020-06-21

IdM-Anmeldung

49 - Deep Learning - Unsupervised Learning Part 4

Prof. Dr. Andreas Maier

2020-06-21

IdM-Anmeldung

50 - Deep Learning - Unsupervised Learning Part 5

Prof. Dr. Andreas Maier

2020-06-21

IdM-Anmeldung

Mehr Videos aus der Kategorie "Technische Fakultät"

12 - Übung Halbleitertechnik II - CMOS Technik (HL II) - Übungsblatt 7 aus WS2023/24 - Teil 1

2025-02-05

IdM-Anmeldung

geschützte Daten

40 - Vorlesungen und Übungen zu Maschinenelemente I

2025-02-04

Studon

geschützte Daten

29 - Artificial Intelligence I

2025-02-05

Frei

freie Daten

29 - Grundlagen der Elektrotechnik I

2025-02-04

IdM-Anmeldung

geschützte Daten

17 - Lecture 16 - Computational Fluid Dynamics 1 (CFD1)

2025-02-04

IdM-Anmeldung

geschützte Daten

28 - Algorithmen und Datenstrukturen (für Medizintechnik)

2025-02-04

Studon

geschützte Daten

45 - Deep Learning - Reinforcement Learning Part 5/ClipID:17721 vorhergehender Clip nächster Clip

Kurs-Verknüpfung

Lehrende(r)

Zugang

Sprache

Einrichtung

Produzent

Format

Typ

Nächstes Video

Mehr Videos aus der Kategorie "Technische Fakultät"