多数大学生出来选择的工作和专业无关
首页 > 专业知识

详解PHP正则表达式替换实现

时间:2018-04-10 17:34:09 [来源]:郑州PHP培训学校

   详解PHP正则表达式替换实现

  PHP正则表达式替换实现是如何的呢?首先向你介绍下PHP preg_replace,PHP preg_replace的使用是我们实现的方法,那么对于PHP正则表达式替换实现过程我们从实例入手。
  PHP正则表达式替换的相关概念:
  preg_replace:执行正则表达式的搜索和替换
  mixed preg_replace (
  mixed pattern,
  mixed replacement,
  mixed subject [, int limit])
  preg_replace:允许你替换字符串中匹配到你定义的正则表达式。一个简单的注释移除功能:
  preg_replace('[(/*)+.+(*/)]', '', $val);
  这段代码可以移除在 PHP 和 CSS 中使用 /* 注释 */ 格式的多多行注释。其中的三个参数分别为正则表达式,要替换成的字符串和要替换的目标字符串(这里要做移除功能,所以是个空白字符串 -> '')。如果你想匹配次级规则,可以使用 $0 代表全部匹配,$1、$2 等,以此类推代表分别的次级规则。
  在 subject 中搜索 pattern 模式的匹配项并替换为 replacement。如果指定了 limit,则仅替换 limit 个匹配,如果省略 limit 或者其值为 -1,则所有的匹配项都会被替换。
  replacement 可以包含 //n 形式或(自 PHP 4.0.4 起)$n 形式的逆向引用,首选使用后者。每个此种引用将被替换为与第 n 个被捕获的括号内的子模式所匹配的文本。n 可以从 0 到 99,其中 //0 或 $0 指的是被整个模式所匹配的文本。对左圆括号从左到右计数(从 1 开始)以取得子模式的数目。
  对替换模式在一个逆向引用后面紧接着一个数字时(即:紧接在一个匹配的模式后面的数字),不能使用熟悉的 //1 符号来表示逆向引用。举例说 //11,将会使 preg_replace() 搞不清楚是想要一个 //1 的逆向引用后面跟着一个数字 1 还是一个 //11 的逆向引用。本例中的解决方法是使用 /${1}1。这会形成一个隔离的 $1 逆向引用,而使另一个 1 只是单纯的文字。
  PHP正则表达式替换的相关实例:
  例子 1. 逆向引用后面紧接着数字的用法
  <?php
  $string = "April 15, 2003";
  $pattern = "/(/w+) (/d+), (/d+)/i";
  $replacement = "/${1}1,/$3";
  print preg_replace($pattern, $replacement, $string);
  /* Output
  ======
  April1,2003
  */
  ?>
  如果搜索到匹配项,则会返回被替换后的 subject,否则返回原来不变的 subject。
  preg_replace() 的每个参数(除了 limit)都可以是一个数组。如果 pattern 和 replacement 都是数组,将以其键名在数组中出现的顺序来进行处理。这不一定和索引的数字顺序相同。如果使用索引来标识哪个 pattern 将被哪个 replacement 来替换,应该在调用 preg_replace() 之前用 ksort() 对数组进行排序。
  例子 2. 在 preg_replace() 中使用索引数组
  <?php
  $string =
  "The quick brown fox jumped over the lazy dog.";
  $patterns[0] = "/quick/";
  $patterns[1] = "/brown/";
  $patterns[2] = "/fox/";
  $replacements[2] = "bear";
  $replacements[1] = "black";
  $replacements[0] = "slow";
  print preg_replace($patterns, $replacements, $string);
  /* Output
  ======
  The bear black slow jumped over the lazy dog.
  */
  /* By ksorting patterns and replacements,
  we should get what we wanted. */
  ksort($patterns);
  ksort($replacements);
  print preg_replace($patterns, $replacements, $string);
  /* Output
  ======
  The slow black bear jumped over the lazy dog.
  */
  ?>
  如果 subject 是个数组,则会对 subject 中的每个项目执行搜索和替换,并返回一个数组。
  如果 pattern 和 replacement 都是数组,则 preg_replace() 会依次从中分别取出值来对 subject 进行搜索和替换。如果 replacement 中的值比 pattern 中的少,则用空字符串作为余下的替换值。如果 pattern 是数组而 replacement 是字符串,则对 pattern 中的每个值都用此字符串作为替换值。反过来则没有意义了。
  /e 修正符使 preg_replace() 将 replacement 参数当作 PHP 代码(在适当的逆向引用替换完之后)。提示:要确保 replacement 构成一个合法的 PHP 代码字符串,否则 PHP 会在报告在包含 preg_replace() 的行中出现语法解析错误。
 
  两个PHP正则表达式特殊字符
  PHP正则表达式特殊字符是我们在实际开发中会碰到的,那么碰到这样的字符将会代表什么不同的特别的含义么?那么这里就向你介绍两种我们经常会碰到的PHP正则表达式特殊字符的使用详解。
  PHP正则表达式特殊字符"[ ]"和"\",那么他们是什么呢?具体的操作是什么呢?之所以他们是特殊字符,那么有什么在使用过程中特别的地方么?来让我们看看具体的介绍。
  还有两个很重要的特殊字符就是"[ ]"。他们可以匹配"[]"之中出现过的字符,比如"/[az]/"可以匹配单个字符"a"或者"z";如果把上面的表达式改成这样"/[a-z]/",就可以匹配任何单个小写字母,比如"a"、"b"等等。
  关于PHP正则表达式特殊字符"[ ]":
  如果在"[]"中出现了"^",代表本表达式不匹配"[]"内出现的字符,比如"/[^a-z]/"不匹配任何小写字母!并且正则表达式给出了几种"[]"的默认值:
  [:alpha:]:匹配任何字母
  [:alnum:]:匹配任何字母和数字
  [:digit:]:匹配任何数字
  [:space:]:匹配空格符
  [:upper:]:匹配任何大写字母
  [:lower:]:匹配任何小写字母
  [:punct:]:匹配任何标点符号
  [:xdigit:]:匹配任何16进制数字
  关于PHP正则表达式特殊字符"\":
  下面这些特殊字符在转义符号"\"转义后代表的含义如下:
  s:匹配单个的空格符
  S:用于匹配除单个空格符之外的所有字符。
  d:用于匹配从0到9的数字,相当于"/[0-9]/"。
  w:用于匹配字母,数字或下划线字符,相当于"/[a-zA-Z0-9_]/"。
  W:用于匹配所有与w不匹配的字符,相当于"/[^a-zA-Z0-9_]/"。
  D:用于匹配任何非10进制的数字字符。
  .:用于匹配除换行符之外的所有字符,如果经过修饰符"s"的修饰,"."可以代表任意字符。
  关于PHP正则表达式特殊字符的介绍就向你介绍到这里,希望那个对你了解和掌握PHP正则表达式特殊字符的使用有所帮助。
 
  PHP中文乱码的常见解决方法总结
  PHP中文乱码是PHP开发中的常见问题之一。PHP中文乱码有时发生在网页本身,有些产生在于MySQL交互的过程中,有时与操作系统有关。下面进行一番总结。
  一.首先是PHP网页的编码
  1. php文件本身的编码与网页的编码应匹配
  a. 如果欲使用gb2312编码,那么php要输出头:header(“Content-Type: text/html; charset=gb2312"),静态页面添加<meta http-equiv="Content-Type" content="text/html; charset=gb2312">,所有文件的编码格式为ANSI,可用记事本打开,另存为选择编码为ANSI,覆盖源文件。
  b. 如果欲使用utf-8编码,那么php要输出头 :header(“Content-Type: text/html; charset=utf-8"),静态页面添加<meta http-equiv="Content-Type" content="text/html; charset=utf-8">,所有文件的编码格式为utf-8。保存为utf-8可能会有点麻烦,一般utf-8文件开头会有BOM,如果使用 session就会出问题,可用editplus来保存,在editplus中,工具->参数选择->文件->UTF-8签名,选择总是删除,再保存就可以去掉BOM信息了。
  2. php本身不是Unicode的,所有substr之类的函数得改成mb_substr(需要装mbstring扩展);或者用iconv转码。
  二.PHP与Mysql的数据交互
  PHP与数据库的编码应一致
  1. 修改mysql配置文件my.ini或my.cnf,mysql最好用utf8编码
  [mysql]
  default-character-set=utf8
  [mysqld]
  default-character-set=utf8
  default-storage-engine=MyISAM
  在[mysqld]下加入:
  default-collation=utf8_bin
  init_connect='SET NAMES utf8'
  2. 在需要做数据库操作的php程序前加mysql_query("set names '编码'");,编码和php编码一致,如果php编码是gb2312那mysql编码就是gb2312,如果是utf-8那mysql编码就是 utf8,这样插入或检索数据时就不会出现乱码了
  三.PHP与操作系统相关
  Windows和Linux的编码是不一样的,在Windows环境下,调用PHP的函数时参数如果是utf-8编码会出现错误,比如 move_uploaded_file()、filesize()、readfile()等,这些函数在处理上传、下载时经常会用到,调用时可能会出现下面的错误:
  Warning: move_uploaded_file()[function.move-uploaded-file]:failed to open stream: Invalid argument in ...
  Warning: move_uploaded_file()[function.move-uploaded-file]:Unable to move '' to '' in ...
  Warning: filesize() [function.filesize]: stat failed for ... in ...
  Warning: readfile() [function.readfile]: failed to open stream: Invalid argument in ..
  在Linux环境下用gb2312编码虽然不会出现这些错误,但保存后的文件名出现乱码导致无法读取文件,这时可先将参数转换成操作系统识别的编码,编码转换可用mb_convert_encoding(字符串,新编码,原编码)或iconv(原编码,新编码,字符串),这样处理后保存的文件名就不会出现乱码,也可以正常读取文件,实现中文名称文件的上传、下载。
  其实还有更好的解决方法,彻底与系统脱离,也就不用考虑系统是何编码。可以生成一个只有字母和数字的序列作为文件名,而将原来带有中文的名字保存在数据库中,这样调用move_uploaded_file()就不会出现问题,下载的时候只需将文件名改为原来带有中文的名字。实现下载的代码如下
  header("Pragma: public");
  header("Expires: 0");
  header("Cache-Component: must-revalidate, post-check=0, pre-check=0");
  header("Content-type: $file_type");
  header("Content-Length: $file_size");
  header("Content-Disposition: attachment; filename=\"$file_name\"");
  header("Content-Transfer-Encoding: binary");
  readfile($file_path);
  $file_type是文件的类型,$file_name是原来的名字,$file_path是保存在服务上文件的地址。

上一篇:PHP和Python的基础特性有哪些

下一篇:巧用PHP正则表达式判断IP地址