Section Title
本方法使用兩個網路來達成學習動作,一為Actor網路,主要用來輸出動作,細心的讀者可能會發現這和之前所介紹的p...
今天要介紹RL的另一個家族Policy gradient,policy gradient顧名思義就是直接輸出動...
Channel Pruning for Accelerating Very Deep Neural Netwo...
一.前言: 相信之前有看小編部落格假設環境的朋友一定不陌生下面這些文章 1.caffe 安裝教學...
Building efficient convnets using redundant feature pru...
繼上次小編發現可以跑AlphaGo 程序後,小編又更進一步的發現覆盤利器-Goreviewpartner。小編...