import torch import torch.nn as NN criterion = NN.CrossEntropyLoss() X=torch.randn([2,150]) Y=torch.randint(0,150,(2,)) print(X.shape) print(Y.shape) loss=criterion(X,Y) loss0=criterion(X[0],Y[0]) loss1=criterion(X[1],Y[1]) loss_all=(loss0+loss1)/2 print(loss) print(loss_all)
输出结果:(因为随机数原因,不会与我的完全一样,但是最后两个值 应该一致)
从上面可以看出,输入X可以是m*n维矩阵,Y是m维向量.
X的每一行(m中的一个)对应Y中的一个值 ,这个值 其实是X中的当前行的argmax的结果,如果loss收敛,这个argmax值和y中的值 应该相同(理论上)。
从上面的代码还可以知道,最后输出的loss实际上是m个n维向量的loss的平均值 。



