栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

Shell脚本-将xml拆分为多个文件

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

Shell脚本-将xml拆分为多个文件

我不会用

getline
。(我什至在AWK书中读到,不建议使用它。)我认为,使用全局变量进行状态处理甚至更简单。(带有全局变量的表达式也可以在模式中使用。)

该脚本可能如下所示:

test-split-xml.awk

/<fileItem>/ {  collect = 1 ; buffer = "" ; file = "fileItem_"count".xml"  ++count}collect > 0 {  if (buffer != "") buffer = buffer"n"  buffer = buffer $0}collect > 0 && /<name>.+</name>/ {  # cut "...<name>"  i = index($0, "<name>") ; file = substr($0, i + 6)  # cut "</name>..."  i = index(file, "</name>") ; file = substr(file, 1, i - 1)  file = file".xml"}/</fileItem>/ {  collect = 0;  print file  print "<?xml version="1.0" encoding="UTF-8"?>" >file  print buffer >file}

我准备了一些样本数据进行小型测试:

test-split-xml.xml

<?xml version="1.0" encoding="UTF-8"?><top>  <some>    <fileItem>      <id>1</id>      <name>X1</name>    </fileItem>  </some>  <fileItem>    <id>2</id>    <name>X2</name>  </fileItem>  <fileItem>    <id>2</id>    <!--name>X2</name-->  </fileItem>  <any> other input </any></top>

…并获得以下输出:

$ awk -f test-split-xml.awk test-split-xml.xmlX1.xmlX2.xmlfileItem_2.xml$ more X1.xml <?xml version="1.0" encoding="UTF-8"?>    <fileItem>      <id>1</id>      <name>X1</name>    </fileItem>$ more X2.xml<?xml version="1.0" encoding="UTF-8"?>  <fileItem>    <id>2</id>    <name>X2</name>  </fileItem>$ more fileItem_2.xml <?xml version="1.0" encoding="UTF-8"?>  <fileItem>    <id>2</id>    <!--name>X2</name-->  </fileItem>$

Tripleee的评论是合理的。因此,这种处理应限于个人使用,因为XML文件的不同(和合法)格式可能会导致此脚本处理中的错误。

您会注意到,

next
整个脚本中没有任何内容。这是故意的。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/399199.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号