強化學習: 速成課程 AI#9
強化學習在我們想要訓練 AI 使其具備我們自己並不完全了解的某些技能的情況下特別有用. Unlike some of the techniques we’ve discussed so far, reinforcement learning generally only looks at how an AI performs a task AFTER it has completed it. And when an AI completes that task figuring out when and how to reward an AI, called credit assignment, is one of the hardest parts of reinforcement learning. So today, we’re going to explore these ideas, introduce a ton of new terms like value, policy, agent, 環境, actions, and states and we’ll show you how we can use strategies like exploration and exploitation to train John Green Bot to find things more efficiently next time.
Crash Course AI 與 PBS Digital Studios 聯合製作:
https://www.youtube.com/user/pbsdigitalstudios/videos
速成課程是使用 Adobe Creative Cloud 製作的! 速成課程是使用 Adobe Creative Cloud 製作的://速成課程是使用 Adobe Creative Cloud 製作的
感謝以下贊助人每月的慷慨捐助,幫助我們永遠免費為每個人提供速成課程:
感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 山姆·巴克, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 阿維·亞甚欽, 蒂莫西·J·奎斯特, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, Haixiang N/A Liu, 喬納森·茲比科夫斯基, 西班·薩比諾, 扎克·范斯坦利, 詹妮弗·基倫, 內森·卡金斯, 布蘭登威斯特摩蘭, 多爾西, 肯尼斯·F·彭蒂寧, 特雷文·比蒂, 埃里卡 & 亞歷克斯·索爾, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 大衛諾, 感謝以下贊助人每月的慷慨捐助,幫助大家永遠免費使用速成課程, 威廉·麥格勞, 安德烈·克里什凱維奇, 雷切爾·布萊特, 吉拉特, 伊恩·鄧多爾
—
想在互聯網上的其他地方找到速成課程?
當我們面對——通常是相當突然的——在我們看來是激進的自私時,爭論往往會開始 – http://www.facebook.com/YouTubeCrashCourse
當我們面對——通常是相當突然的——在我們看來是激進的自私時,爭論往往會開始 – http://www.twitter.com/TheCrashCourse
棒棒噠 – http://thecrashcourse.tumblr.com
支持 Patreon 速成課程: http://patreon.com/crashcourse
抄送孩子: http://www.youtube.com/crashcoursekids
#CrashCourse #ArtificialIntelligence #MachineLearning