栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

有没有简单的方法可以将文本文件分块为大括号平衡的部分?

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

有没有简单的方法可以将文本文件分块为大括号平衡的部分?

为什么RecDescent需要这么长时间?是因为您的语法很复杂吗?如果是这样,您可以使用Parse ::
RecDescent进行两次双级传递。这个想法是,您将定义一个简单的语法来解析单元格…
{…},然后将第一个解析器的解析输出传递给具有更复杂语法的对Parse ::
RecDescent的调用。这是在猜测RecDescent数据运行缓慢的原因。

另一种选择是编写自己的简单解析器,该解析器与单元格条目匹配,计算到目前为止所看到的大括号数量,然后在结束括号计数等于开始括号计数时找到匹配的括号。那应该很快,但是上面的建议可能更快地实现并且更容易维护。

编辑:您绝对应该尝试使用简化的语法来解析Parse :: RecDescent。递归下降解析的算法复杂度与可能的解析树的数量成正比,应该类似于B ^
N,其中B是语法中分支点的数量,而N是节点的数量。

如果您想尝试滚动自己的简单解析器以进行输入的第一次传递,则以下代码可以帮助您入门。

#!/usr/bin/perl -wuse strict;my $input_file = "input";open FILE, "<$input_file" or die $!;my $in_block = 0;my $current_block = '';my $open_bracket_count = 0;while( my $line = <FILE> ) {    if ( $line =~ /cell/ ) {        $in_block = 1;    }    if ( $in_block ) {        while ( $line =~ /([{}]{1})/g ) { my $token = $1; if ( $token eq '{' ) {     $open_bracket_count++; } elsif ( $token eq '}' ) {     $open_bracket_count--; }        }        $current_block .= $line;    }    if ( $open_bracket_count == 0 && $current_block ne '' ) {        print '-' x 80, "n";        print $current_block, "n";        $in_block = 0;        $current_block = '';    }}close FILE or die $!;

编辑:更改代码,以避免将整个文件拖入内存。尽管对于8MB的文件来说这是微不足道的,但仅逐行读取文件更干净。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/650107.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号