前情提要:有一些表没有注释,但是hbm.xml里面有注释。但是文档里又需要注释,不想一个个改的我,就想到了这个办法。藍
先批量生成注释,然后插入数据库,然后再导入文档
为了懒,可太不容易了
好了,开始
import pandas as pd
from xml.dom.minidom import parse
import xml.dom.minidom
import codecs
fileName_in=r'C:Users李Desktop1.hbm.xml'
#gb312转utf-8
with codecs.open(filename=fileName_in,mode='r',encoding='GB312') as fi:
data = fi.read()
with open(fileName_in,mode='w',encoding='utf-8') as fo:
data = data.replace("GB312",'utf-8')
fo.write(data)
fo.close()
#用dom载入hbm.xml
DOMTree = xml.dom.minidom.parse(fileName_in)
#根节点
root = DOMTree.documentElement
#待填充列表
list1 = []
#获取表名
tableName = root.getElementsByTagName("class")[0].getAttribute("table")
tableChinese = root.getElementsByTagName("meta")[0].childNodes[0].data
list1.append('COMMENT ON TABLE'+tableName+' is ''+tableChinese+'''+'n')
#待拼接字符串
str1 = 'CIMMENT ON COLUMN '+tableName+'.'
#获取主键
priMary = root.getElementsByTagName("id")[0]
meta = priMary.getElementsByTagName("meta")[0].childNodes[0].data
column = priMary.getElementsByTagName("column")[0].getAttribute("name")
list1.append(str1+column+' is ''+meta+'''+'n')
#获取其他字段
propertys = root.getElementsByTagName("property")
for property in propertys:
meta = property.getElementsByTagName("meta")[0].childNodes[0].data
column = property.getElementsByTagName("column")[0].getAttribute("name")
list1.append(str1+column+' is ''+meta+'''+'n')
#写入txt
f = open(r"C:Users李Desktop1.txt","w")
f.writelines(list1)
f.close()
解释一下大概的思路
整个代码分为以下几段,我由注释分割开来。
(1)首先,如果你的xml文档是gb312或者其他,要先转为utf-8(文档内注明的编码格式也要替换掉)。是utf-8的话,可删除这段代码
(2) 然后是用dom载入xml文档,这样的好处是以树形结构去解析xml文档,便于获取各个节点
(3) 第三步就是获取各个节点并拼接了
(4) 最后打印出来或者像我一样放到文档里,也行。
当然,这只是核心代码,你也可以为他加点其他的,比如将其转为exe?为他加个直接导入数据库的功能啥的



