Apprendimento tramite rinforzo: Padroneggiare il processo decisionale intelligente per le macchine autonome

· Scienza Della Robotica [Italian] Book 50 · Un Miliardo Di Ben Informato [Italian] · AI-narrated by Italo (from Google)
Audiobook
5 hr 28 min
Unabridged
Eligible
AI-narrated
Ratings and reviews aren’t verified  Learn More
Want a 29 min sample? Listen anytime, even offline. 
Add

About this audiobook

Nel campo in rapida evoluzione della robotica, l'apprendimento per rinforzo è uno dei metodi più promettenti per la creazione di sistemi autonomi. Questo libro, Reinforcement Learning, fornisce un'esplorazione approfondita di questa potente tecnica, guidando i lettori attraverso i suoi principi fondamentali fino ai suoi ultimi progressi. Perfetto per professionisti, studenti laureati e appassionati, questo libro offre un approccio dettagliato ma accessibile per comprendere l'apprendimento per rinforzo nel contesto della robotica.


Breve panoramica dei capitoli:


1: Apprendimento per rinforzo: introduce il concetto fondamentale dell'apprendimento per rinforzo, sottolineandone il ruolo nei sistemi autonomi.


2: Processo decisionale di Markov: spiega il quadro matematico per il processo decisionale in condizioni di incertezza, un fondamento fondamentale per l'apprendimento per rinforzo.


3: Apprendimento delle differenze temporali: esplora metodi per apprendere dall'esperienza senza aver bisogno di un modello dell'ambiente.


4: Equazione di Bellman: discute la relazione ricorsiva critica che sta alla base di molti algoritmi di apprendimento per rinforzo.


5: Qlearning: si concentra su un algoritmo di apprendimento di rinforzo offpolicy che apprende azioni ottimali senza un modello dell'ambiente.


6: Multiarmed bandit: copre un problema di apprendimento di rinforzo più semplice che modella il processo decisionale in ambienti incerti.


7: Processo decisionale di Markov parzialmente osservabile: espande i tradizionali processi decisionali di Markov incorporando stati nascosti.


8: Indice di Gittins: introduce una strategia per bilanciare esplorazione e sfruttamento nei problemi multiarmed bandit.


9: Stato-azione-ricompensa-stato-azione: approfondisce i modelli temporali nell'apprendimento di rinforzo che informano le strategie decisionali.


10: Funzione protovalore: esplora metodi per approssimare le funzioni valore, aiutando nell'efficienza dell'apprendimento.


11: Costruzione automatica della funzione di base: si concentra sui metodi automatici per costruire funzionalità per migliorare l'efficienza dell'apprendimento.


12: Teoria dei giochi Meanfield: discute un framework per la modellazione delle interazioni in sistemi multiagente su larga scala.


13: Multiagent pathfinding: introduce algoritmi per coordinare più agenti per raggiungere le loro destinazioni in modo efficiente.


14: Modelfree (apprendimento per rinforzo): discute metodi che non si basano su un modello dell'ambiente per l'apprendimento.


15: Deep reinforcement learning: combina apprendimento profondo e apprendimento per rinforzo per gestire ambienti complessi e ad alta dimensione.


16: Multiagent reinforcement learning: si concentra sulle strategie per l'apprendimento in ambienti con più agenti interagenti.


17: Selfplay: esplora il concetto di agenti che apprendono attraverso la competizione con se stessi, una componente critica delle strategie di apprendimento avanzate.


18: Ottimizzazione delle policy prossimali: introduce un algoritmo per ottimizzare le policy nell'apprendimento per rinforzo con stabilità e prestazioni migliorate.


19: Dilemma di esplorazione-sfruttamento: discute la sfida fondamentale di bilanciare l'esplorazione di nuove strategie con lo sfruttamento di quelle note.


20: Apprendimento per rinforzo da feedback umano: esamina metodi per migliorare l'apprendimento per rinforzo utilizzando input umani.


21: Apprendimento per imitazione: si concentra sulle tecniche in cui gli agenti apprendono imitando le azioni degli esperti umani.

About the author

Fouad Sabry è l'ex Responsabile Regionale dello Sviluppo Commerciale per le Applicazioni di HP. Fouad ha conseguito la laurea triennale in Sistemi Informatici e Controllo Automatico nel 1996, una doppia laurea magistrale presso l'Università di Melbourne (UoM) in Australia, un Master in Business Administration (MBA) nel 2008 e un Master in Management in Information Technology (MMIT) nel 2010. Fouad vanta oltre 30 anni di esperienza nei settori dell'Information Technology e delle Telecomunicazioni, maturati in aziende locali, regionali e internazionali, come Vodafone e IBM. Fouad è entrato in HP nel 2013 e ha contribuito allo sviluppo del business in decine di mercati. Attualmente, Fouad è imprenditore, autore, futurista e fondatore dell'iniziativa One Billion Knowledge (1BK).

Rate this audiobook

Tell us what you think.

Listening information

Smartphones and tablets
Install the Google Play Books app for Android and iPad/iPhone. It syncs automatically with your account and allows you to read online or offline wherever you are.
Laptops and computers
You can read books purchased on Google Play using your computer's web browser.

Continue the series

More by Fouad Sabry

Similar audiobooks