我将为您分解。如您所知,张量是多维矩阵。原始形式的参数是张量,即多维矩阵。它是变量类的子类。
与模块关联时,会出现变量和参数之间的差异。当参数与作为模型属性的模块关联时,它会自动添加到参数列表中,并且可以使用“参数”迭代器进行访问。
最初在Torch中,变量(例如可能是中间状态)也将在分配时作为模型的参数添加。后来发现了用例,其中确定了需要缓存变量而不是将其添加到参数列表中的需求。
如文档中所述,RNN就是这种情况,您需要保存最后一个隐藏状态,因此不必一次又一次地传递它。需要缓存一个变量,而不是让它自动作为模型的参数注册,这就是为什么我们有一种明确的方法将参数注册到模型中,即nn.Parameter类。
例如,运行以下代码-
import torchimport torch.nn as nnfrom torch.optim import Adamclass NN_Network(nn.Module): def __init__(self,in_dim,hid,out_dim): super(NN_Network, self).__init__() self.linear1 = nn.Linear(in_dim,hid) self.linear2 = nn.Linear(hid,out_dim) self.linear1.weight = torch.nn.Parameter(torch.zeros(in_dim,hid)) self.linear1.bias = torch.nn.Parameter(torch.ones(hid)) self.linear2.weight = torch.nn.Parameter(torch.zeros(in_dim,hid)) self.linear2.bias = torch.nn.Parameter(torch.ones(hid)) def forward(self, input_array): h = self.linear1(input_array) y_pred = self.linear2(h) return y_predin_d = 5hidn = 2out_d = 3net = NN_Network(in_d, hidn, out_d)
现在,检查与此模型关联的参数列表-
for param in net.parameters(): print(type(param.data), param.size())""" Output<class 'torch.FloatTensor'> torch.Size([5, 2])<class 'torch.FloatTensor'> torch.Size([2])<class 'torch.FloatTensor'> torch.Size([5, 2])<class 'torch.FloatTensor'> torch.Size([2])"""
或者尝试
list(net.parameters())
这可以很容易地馈送到您的优化器-
opt = Adam(net.parameters(), learning_rate=0.001)
另外,请注意,参数默认情况下已设置了require_grad。



