通过和使用简单的正则表达式通常是最短和最快的选择:
preg_match_all
array_combine
preg_match_all("/([^\\]+)\\([^\\]+)/", $string, $p); $array = array_combine($p[1], $p[2]);现在,这当然是一个特例。 键 和 值 都以
反斜杠分隔,所有 键对 和 值 也是如此。由于必须进行两次转义,因此正则表达式也更长一些。但是,可以将该方案推广到其他
key:value,样式的字符串。
不同的key:value,
分隔符
常见的变体包括
:和
=作为键/值分隔符,和
,/
&和其他作为对定界符。在这种情况下,正则表达式变得非常明显(带有
/x可读性标记):
# ↓ ↓ ↓ preg_match_all("/ ([^:]+) : ([^,]+) /x", $string, $p); $array = array_combine($p[1], $p[2]);这使得超级容易交流
:和
,其他分隔符。
- 等号
=
代替:
冒号。 - 例如
\t
作为对定界符(制表符分隔的键:值列表) - 经典
&
或;
作为键=值对之间的分隔符。 - 甚至只是
\s
空格或\n
换行符。
允许使用不同的定界符
您可以通过在键/值/对之间使用不同的分隔符来使其更加灵活/宽容:
# ↓ ↓ ↓ preg_match_all("/ ([^:=]+) [:=]+ ([^,+&]+) /x", $string, $p);两者
key=value,key2:value2++key3==value3都会在哪里工作。对于更多的人际友好(AKA非技术用户),这可能更有意义。
约束字母数字键
通常,您可能要禁止除经典
key标识符以外的任何内容。只需使用
w+字串模式即可使正则表达式跳过不必要的事件:
# ↓ ↓ ↓ preg_match_all("/ (w+) = ([^,]+) /x", $string, $p);这是最简单的白名单方法。如果是OTOH,您想预先 声明
/约束整个键/值字符串,则可以单独制作一个
preg_match("/^(w+=[^,]+(,|$))+/", …删除空格或引用
您可以跳过一些后处理步骤(例如
trim在键和值上),并添加少量内容:
preg_match_all("/ s*([^=]+) s*=s* ([^,]+) (?<!s) /x", $string, $p);或例如可选引号:
preg_match_all("/ s*([^=]+) s*=s* '? ([^,]+) (?<![s']) /x", $string, $p);INI样式提取
您可以设计基准INI文件提取方法:
preg_match_all("/^ s*(w+) s*=s* ['"]?(.+?)['"]? s* $/xm", $string, $p);请注意,这只是普通INI方案的 粗略子集 。
选择: parse_str()
如果您已经有一个
key=value&key2=value2字符串,那么它
parse_str就像一个符咒。但是通过与它结合
strtr甚至可以处理其他定界符:
# ↓↓ ↑↑ parse_str(strtr($string, ":,", "=&"), $pairs);
它有两个 优点和缺点 :
- 甚至比两行正则表达式方法还短。
- 预定义一种众所周知的转义机制,例如
%2F
特殊字符)。 - 不允许在其中使用不同的定界符或未转义的定界符。
- 自动转换
keys[]=
为数组,您可能想要也可能不需要。
另类:explode
+foreach
您会发现许多手动键/值字符串扩展的示例。尽管这通常是更多的代码。
explode由于优化假设,在PHP中有些过度使用。分析后,由于手动
foreach和数组收集,通常发现速度较慢。



