栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 软件开发 > 后端开发 > Python

Actor-critic算法

Python 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Actor-critic算法

Actor-critic算法



import random
import matplotlib.pyplot as plt
x=[]
y=[]
def random_pick(some_list, probabilities): 
        random_num = random.uniform(0,1) 
        cumulative_probability = 0.0 
        for item, item_probability in zip(some_list, probabilities):   #遍历
            cumulative_probability += item_probability 
            if random_num < cumulative_probability:
                break 
        return item
probabilities=[0.5,0.5]

some_list=[1.02,1.74]
sum1=sum2=k=0

for i in range(10000):
    
    a=random_pick(some_list,probabilities)
    k+=1
    b=some_list.index(a)
    if b==0:
        sum1+=a
    else:
        sum2+=a
      
    if i%10==0:
        probabilities[0]+=0.01*sum1
        probabilities[1]+=0.01*sum2
        probabilities[0]=probabilities[0]/sum(probabilities)
        probabilities[1]=probabilities[1]/sum(probabilities)
        print(sum1,sum2)
        sum1=sum2=0
        #print(probabilities)
          
    y.append(probabilities[0])
    x.append(i)
print(probabilities)
plt.plot(x,y,color='g',linestyle='-')
转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/587605.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号