我不知道您是否熟悉
sed基于UNIX(但Windows可用)的文本解析程序,但是我在这里找到了一个sed脚本,该脚本将从文件中删除C
/ C ++注释。非常聪明;例如,如果在字符串声明中找到它,它将忽略“ //”和“ / *”。在Python中,可以使用以下代码来使用它:
import subprocessfrom cStringIO import StringIOinput = StringIO(source_pre) # source_pre is a string with the source pre.output = StringIO()process = subprocess.Popen(['sed', '/path/to/remccoms3.sed'], input=input, output=output)return_pre = process.wait()stripped_pre = output.getvalue()
在此程序中,
source_pre是保存C / C 源代码的变量,并且最终
stripped_pre将保留C / C
代码并删除注释。当然,如果文件在磁盘上,则可以将
input和
output变量作为指向这些文件的文件句柄(
input在读取模式下,
output在写入模式下)。
remccoms3.sed是以上链接中的文件,应将其保存在磁盘上的可读位置。
sed在Windows上也可用,并且在大多数GNU
/ Linux发行版和Mac OS X上默认安装。
这可能会比纯Python解决方案更好。无需重新发明轮子。



