栏目分类:
子分类:
返回
名师互学网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
名师互学网 > IT > 面试经验 > 面试问答

PHP从文件中读取最后几行的最佳方法是什么?

面试问答 更新时间: 发布时间: IT归档 最新发布 模块sitemap 名妆网 法律咨询 聚返吧 英语巴士网 伯小乐 网商动力

PHP从文件中读取最后几行的最佳方法是什么?

方法概述

在互联网上搜索时,我遇到了不同的解决方案。我可以将它们分为三种方法:

  • 天真 的使用
    file()
    PHP函数的人;
  • 作弊
    tail
    在系统上运行命令;
  • 强大 的使用
    fseek()

我最终选择了(或写出了)五个解决方案,一个 幼稚的 解决方案,一个 作弊的 解决方案和三个 强大 的解决方案。

  1. 最简洁的 天真的 解决方案,使用内置数组函数。
  2. 基于
    tail
    command的[ 唯一可能的解决方案 有一个大问题:如果
    tail
    不可用,它将无法运行,即在非Unix(Windows)或不允许系统功能的受限环境中运行。
  3. 从文件末尾读取 单个字节 以查找(并计数)换行符的解决方案 。
  4. 针对大文件进行了优化的 多字节缓冲 解决方案。
  5. 解决方案4的略微 修改版本, 其中缓冲区长度是动态的,取决于要检索的行数。

所有解决方案均 有效
。从某种意义上说,它们可以从任何文件返回任意数目的预期结果(解决方案#1除外,在大型文件的情况下,这可能会破坏PHP内存限制,不返回任何内容)。但是哪个更好?

性能测试

为了回答这个问题,我进行了测试。这些就是这样完成的,不是吗?

我准备了一个样本 100 KB文件,将

/var/log
目录中的不同文件结合在一起。然后,我编写了一个PHP脚本,该脚本使用这五个解决方案中的每一个从文件末尾检索
1、2,..,10、20,… 100、200,…,1000 行。每个测试重复十次(大约 5×28×10 = 1400次
测试),以毫秒为单位测量 平均经过时间

我使用PHP命令行解释器在本地开发计算机(Xubuntu 12.04,PHP 5.3.10、2.70 GHz双核CPU,2 GB
RAM)上运行脚本。

解决方案#1和#2似乎更糟。仅当我们需要阅读几行时,解决方案3才是好的。 解决方案4和5似乎是最好的。
注意动态缓冲区的大小如何优化算法:由于减少了缓冲区,执行时间在几行中要短一些。

让我们尝试更大的文件。如果我们必须读取 10 MB的 日志文件怎么办?

现在,解决方案#1到目前为止是最糟糕的:实际上,将整个10
MB文件加载到内存中并不是一个好主意。我也在1MB和100MB文件上运行测试,实际上是相同的情况。

解决方案#1是现在最好的解决方案!对于PHP而言,将10 KB的内存加载到内存中并不是什么大问题。#4和#5的表现也不错。但这是一个极端的情况:10
KB日志意味着大约150/200行…

您可以 在此处下载我的所有测试文件,源和结果

最后的想法

强烈建议在一般用例中使用
解决方案#5
:适用于每种文件大小,并且在读取几行内容时表现特别好。

如果您应该读取大于10 KB的文件,请避免使用
解决方案#1

解决方案 #2
#3
并不是我进行的每个测试的最佳选择:#2永远不会在2毫秒内运行,并且#3受到您要求的行数的严重影响(仅对1或2行有效)。



转载请注明:文章转载自 www.mshxw.com
本文地址:https://www.mshxw.com/it/433211.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 MSHXW.COM

ICP备案号:晋ICP备2021003244-6号