Seminar Meta Learning (SemMeL) - Anil Bora Yayak - Neural Architecture Search with Reinforcement Learning

7 - Seminar Meta Learning (SemMeL) - Anil Bora Yayak - Neural Architecture Search with Reinforcement Learning/ClipID:26554 vorhergehender Clip nächster Clip

0 seconds of 0 secondsVolume 90%

00:00

Schlüsselworte: meta learning

Die automatischen Untertitel, die mit Whisper Open AI in diesem Video-Player (und im Multistream-Video-Player) generiert werden, dienen der Bequemlichkeit und Barrierefreiheit. Es ist jedoch zu beachten, dass die Genauigkeit und Interpretation variieren können. Für mehr Informationen lesen Sie bitte die FAQs (Absatz 14)

Aufnahme Datum 2020-12-14

Video CC Herunterladen Clip RSS Feeds

Kurs-Verknüpfung

Seminar Meta Learning (SemMeL)

Lehrende(r)

Prof. Dr. Andreas Maier

Zugang

Frei

Sprache

Englisch

Einrichtung

Friedrich-Alexander-Universität Erlangen-Nürnberg

Produzent

Friedrich-Alexander-Universität Erlangen-Nürnberg

Abstract
Neural networks are powerful and flexible models that work well for many difficult learning tasks in image, speech and natural language understanding. Despite their success, neural networks are still hard to design. In this paper, we use a recurrent network to generate the model descriptions of neural networks and train this RNN with reinforcement learning to maximize the expected accuracy of the generated architectures on a validation set. On the CIFAR-10 dataset, our method, starting from scratch, can design a novel network architecture that rivals the best human-invented architecture in terms of test set accuracy. Our CIFAR-10 model achieves a test error rate of 3.65, which is 0.09 percent better and 1.05x faster than the previous state-of-the-art model that used a similar architectural scheme. On the Penn Treebank dataset, our model can compose a novel recurrent cell that outperforms the widely-used LSTM cell, and other state-of-the-art baselines. Our cell achieves a test set perplexity of 62.4 on the Penn Treebank, which is 3.6 perplexity better than the previous state-of-the-art model. The cell can also be transferred to the character language modeling task on PTB and achieves a state-of-the-art perplexity of 1.214.

https://arxiv.org/abs/1611.01578?twitter=@bigdata

Nächstes Video

8 - Seminar Meta Learning (SemMeL) - Lena Eichermüller - A Meta-Transfer Objective for Learning to Disentangle Causal Mechanisms

Prof. Dr. Andreas Maier

2020-12-25

IdM-Anmeldung

9 - Seminar Meta Learning (SemMeL) - Nupur Patel - Meta-Learning with Memory-Augmented Neural Networks

Prof. Dr. Andreas Maier

2021-01-13

IdM-Anmeldung / Passwort

10 - Seminar Meta Learning (SemMeL) - Jingwei Song - Optimization as a Model for Few-Shot Learning

Prof. Dr. Andreas Maier

2021-01-18

Frei

11 - Seminar Meta Learning (SemMeL) - Balaka Dutta - Meta Networks

Prof. Dr. Andreas Maier

2021-02-01

Frei

12 - Seminar Meta Learning (SemMeL) - Swetha Ramesh - Learning to Compare: Relation Network for Few-Shot Learning

Prof. Dr. Andreas Maier

2021-02-01

IdM-Anmeldung

Mehr Videos aus der Kategorie "Friedrich-Alexander-Universität Erlangen-Nürnberg"

FAU Alumni #JobInsights mit Heike Nowak-Schwerdtfeger, Psychologie (Dipl.) & Organisations- und Personalentwicklung (M.A.)

2025-04-22

Frei

freie Daten

Familie & Beruf

2025-04-22

Frei

freie Daten

NHR PerfLab Seminar 2025-04-15: Neuromorphic Hardware – A System Perspective

2025-04-22

Frei

freie Daten

Einführung in die sportmedizinische Leistungsdiagnostik 2

2025-04-17

IdM-Anmeldung

geschützte Daten

Neurothemen u.a.

2025-04-17

Studon

geschützte Daten

HPC Café on April 8, 2025: BayernKI – Resources and Support for AI Research in Bavaria

2025-04-15

Frei

freie Daten