模型|拓端tecdat|R语言RStan贝叶斯:重复试验模型和种群竞争模型Lotka Volterra Stan通过马尔可夫链蒙特卡罗方法(例如No-U-Turn采样器,一种汉密尔顿蒙特卡洛采样的自适应形... 2021-07-25
种群|上海交大开源多智能体并行训练框架,支持大规模基于种群多智能体强化 MALib支持丰富的种群训练方式(例如,self-play|PSRO|leaguetraining),并且实现和优化了常见多智能体... 2021-07-22