2021SC@SDUSC
我们小组研究的课题是《知识图到文本的生成》,项目原材料1.相关论文 2.相关源代码,相关链接如下:
PDF: https://aclanthology.org/N19-1238.pdf
代码link:https://github.com/rikdz/GraphWriter
文章就以下四点展开论述
1.提出了一个新的图转换编码器,该编码器成功地将序列变换器应用于图结构化的输入。 2. 展示了IE输出如何形成为一个连接的、未标记的图形,以用于基于注意力的编码器。
3.提供了与科学为本匹配的大的知识图谱数据集,以用于未来的研究。
4.通过详细的自动和人工评估,证明了自动提取的知识可以用于多句文本生成。 并进一步表明,与其他编码器-解码器设置相比,将这种知识结构化和编码为图形可提高生成性能。 最后,证明GraphWriter的转换器样式编码器在知识图文转换方面比Graph Attention Networks更有效。
该该项目所需的环境为Python 3.6+Pytorch,深度学习框架的搭建需要尽可能采用GPU加速大量计算,英伟达显卡提供了CUDA辅助支持。以下是环境搭建详细内容。
一.Python的安装Python的官网下载网址:https://www.python.org/downloads/windows/
注意下载合适的版本,尽量选择3.5~3.7之间的版本,否则可能导致其他环境配置的不兼容和不稳定。根据电脑位数选择32bit或64bit对应的安装包下载
二.CUDA与cuDNN安装 CUDA 的下载官网网址为: https://developer.nvidia.com/cuda-downloads CUDA 历史版 官网链接: https://developer.nvidia.com/cuda-toolkit archive cuDNN 的下载官网网址为: https://developer.nvidia.com/rdp/cudnn-download 在下载之前需查看电脑显卡配置 右键windows,选择设备管理器会出现以下窗口Windows+R,输入cmd可进入终端
输入python可查看python是否安装成功以及安装的版本
如图所示没有报错,且显示python版本为3.6.7
显示适配器显示显卡为Intel(R)系,非英伟达,不支持cuda等下载安装,所以此gpu配置跳过。三.Pytorch的安装 由于电脑没有 GPU ,需安装 tensorflow CPU 版本,安装流程如下: 使用快捷键“ win+R ”快捷键调出窗口( win 键在 alt 键旁边),输入“ cmd ”, 打开命令行终端。 输入以下指令即可安装Pytorch CPU 版:
# CPU only Python -m pip install torch==1.2.0+cpu torchvision==0.4.0+cpu -f https://download.pytorch.org/whl/torch_stable.html其中 1.2.0 和 0.4.0 为版本号,安装对应的即可。 安装完成后,在命令行输入 python 。然后输入 import torch,如果没报错则安装完成。
四.小组分工
阅读完论文和大致代码后,小组展开分工及后续工作安排的讨论。由论文我们发现该项目任务主要分为四个部分:模型训练,编码器,解码器,实验评估,其中编码器包括两个子部分:图准备,图转换器。这个算法包含了一份数据集和6个.py的文件,代码流程大致为数据预处理、编码器、解码器、实验评估。后续我将就eval.py,pargs.py,vectorize.py三部分代码进行重点分析。



