小編原本也是一個懵懵懂懂
對 什麼事 AI 也不清楚的一個人
只知道 AI 是人工智慧
很多東西都可以利用人工智慧學習出來
剛開始也只是知道一些皮毛演算法
如: PSO 基因演算法 kalman filter
進到研究所後我學習到第一個 真的AI演算法
也是令我驚奇的一個演算法
Reinforcement Learning
讀者有興趣可以看看這本書
An introduction to Reinforcement Learning
Sutton 真的很厲害 也講得很好
幾乎現有做AI研究的 大概都是基於這本書
著名的 Google 學習打遊戲 學習下圍棋
也都是以 Reinforcement learning 為基礎加強而來
讀者有興趣的話 可以先實作出 Q-learning 出來
Q-learning 屬於 Reinforcement learning 的其中一種
是目前最為廣泛的演算法
Google 的 play Atari game 也是使用 Q-learning 演算法
關於Q learning 的相關知識可以參考這篇:http://mnemstudio.org/path-finding-q-learning-tutorial.htm
還有中文翻譯版本:http://blog.csdn.net/itplus/article/details/9361915
最簡單的就是利用 Q learning 寫出一個走迷宮程式
演算法慢慢學習 會漸漸學出最短路徑出來
我第一次跑出來的時候 真的覺得很驚奇~~~
但是傳統 Reinforcement learning 是用矩陣做運算
當狀態太多時 我們無法用矩陣去算 會算很久
而且可能算不出來 也沒有generalization(泛化)的功能
因此 google 將 傳統的矩陣算法 改成類神經
用類神經存取 傳統我們俗稱的 Q table 來進行運算
成功的解決傳統 Reinforcement learning 狀態太多的窘境
後來 google 還把他擴展 加上其他演算法
做出鼎鼎有名的 Alpha Go
比賽那幾天 小編可是全程觀看阿
都把研究拋在一邊了 哈哈
後來小編繼續追蹤 發現 DeepMind 也解決了 Robotic 控制的問題
不過用的是更高深的演算法 policy gradient
有興趣的可以去翻翻 裡面一堆數學阿~~
小編看的頭都暈了~~
運用此演算法 Google 成功地做出 讓演算法學習出把球踢進目標的機器人
最近小編又看到最新發展
google 已經做出讓機器手臂學習移動到目標點了
小編是在這個網站上看到的
他寫的文章 小編都覺得很棒
大家有空也可以去看看
最前沿:从虚拟到现实,迁移深度增强学习让机器人革命成为可能!
相信在不遠的將來
機器人就能走入每個人的家庭中了~
就像電腦進入家庭一樣
這就是小編目前追蹤的結果
如果有什麼最新發展小編會在告訴大家的~~
在研所剛開始接觸人工智慧,也很有興趣!
你的部落格對我幫助很大!讚讚讚!
哈哈 你好喔~
我也是對這個很有興趣~
越做越好玩~~
一起加油喔~
我也在學習中
現在只是寫一些工具教學
未來有時間想寫一些演算法教學
尤其是RL~數學超漂亮的~
我是做CNN的 想問你的RL是用在哪呀? 對這塊還不是很熟
版主回覆:(04/07/2022 02:46:22 PM)
是接在後面喔
CNN對於RL來說算是它的state
這部份我以後也會寫
您可以先參考這篇
他蠻詳細的介紹類神經和RL怎麼結合
https://zhuanlan.zhihu.com/p/21477488?refer=intelligentunit
差別就是他沒用CNN