Section Title

Actor Critic 原理說明

本方法使用兩個網路來達成學習動作,一為Actor網路,主要用來輸出動作,細心的讀者可能會發現這和之前所介紹的p...

Policy gradient 原理說明

今天要介紹RL的另一個家族Policy gradient,policy gradient顧名思義就是直接輸出動...

快速搭建Tensorflow深度學習環境–Nvidia-docker

  一.前言: 相信之前有看小編部落格假設環境的朋友一定不陌生下面這些文章 1.caffe 安裝教學...

用AI 教你下圍棋

繼上次小編發現可以跑AlphaGo 程序後,小編又更進一步的發現覆盤利器-Goreviewpartner。小編...