该文档为datawhale情感分析组队学习的笔记
Github地址 team-learning-nlp/Emotional_Analysis at master · datawhalechina/team-learning-nlp (github.com)
第一 我们不需要在 LABEL 字段中设置 dtype。在处理多类问题时 PyTorch 期望标签被数字化为LongTensor。
第二 这次我们使用的是TREC数据集而不是IMDB数据集。 fine_grained 参数允许我们使用细粒度标签 其中有50个类 或不使用 在这种情况下它们将是6个类 。
细粒度模型,通俗的讲就是将业务模型中的对象加以细分,从而得到更科学合理的对象模型,直观的说就是划分出很多对象.
6 个标签 对于非细粒度情况 对应于数据集中的 6 类问题 HUM 关于人类的问题ENTY 关于实体的问题的DESC 关于要求提供描述的问题NUM 关于答案为数字的问题LOC 关于答案是位置的问题ABBR 关于询问缩写的问题 output_dim output_dim len(LABEL.vocab)---------6 损失函数BCEWithLogitsLoss 一般用来做二分类 而 CrossEntropyLoss用来做多分类 CrossEntropyLoss 对我们的模型输出执行 softmax 函数 损失由该函数和标签之间的 *交叉熵 * 给出。
一般来说
当我们的示例仅属于


