多数大学生出来选择的工作和专业无关
首页 > 专业知识

PHP程序开发中的中文编码问题

时间:2018-10-12 19:19:03 [来源]:郑州PHP培训学校

   PHP程序开发中的中文编码问题

  PHP程序设计中中文编码问题经常会困扰很多没有处理这方面问题经验的人,其实导致这个问题的原因很简单,每个国家(或区域)都规定了计算机信息交换用的字符编码集,如美国的扩展 ASCII 码, 中国的 GB2312-80,日本的 JIS 等。作为该国家/区域内信息处理的基础,字符编码集起着统一编码的重要作用。字符编码集按长度分为 SBCS(单字节字符集),DBCS(双字节字符集)两大类。早期的软件(尤其是操作系统),为了解决本地字符信息的计算机处理,出现了各种本地化版本(L10N),为了区分,引进了 LANG, Codepage 等概念。但是由于各个本地字符集代码范围重叠,相互间信息交换困难; 软件各个本地化版本独立维护成本较高。因此有必要将本地化工作中的共性抽取出来,作一致处理,将特别的本地化处理内容降低到最少。这也就是所谓的国际化 (118N)。各种语言信息被进一步规范为 Locale 信息。处理的底层字符集变成了几乎包含了所有字形的 Unicode。
  现在大部分具有国际化特征的软件核心字符处理都是以 Unicode 为基础的,在软件运行时根据当时的ocale/Lang/Codepage 设置确定相应的本地字符编码设置,并依此处理本地字符。在处理过程中需要实现 Unicode 和本地字符集的相互转换,甚或以 Unicode 为中间的两个不同本地字符集的相互转换。这种方式在网络环境下被进一步延伸,任何网络两端的字符信息也需要根据字符集的设置转换成可接受的内容。
  数据库中的字符集编码问题
  流行的关系数据库系统都支持数据库字符集编码,也就是说在创建数据库时可以指定它自己的字符集设置,数据库的数据以指定的编码形式存储。当应用程序访问数据时,在入口和出口处都会有字符集编码的转换。对于中文数据,数据库字符编码的设置应当保证数据的完整性。GB2312、GBK、UTF-8 等都是可选的数据库字符集编码; 当然我们也可以选择 ISO8859-1 (8-bit),只是我们得在应
  用程序写数据之前先将 16Bit 的一个汉字或 Unicode 拆分成两个 8-bit 的字符,读数据之后也需要将两个字节合并起来,同时还要判别其中的 SBCS 字符,因此我们并不推荐采用 ISO8859-1 作为数据库字符集编码。这样不但没有充分利用数据库自身的字符集编码支持,而且同时也增加了编程的复杂度。编程时,可以先用数据库管理系统提供的管理功能检查其中的中文数据是否正确。
  PHP 程序在查询数据库之前,首先执行 mysql_query("SET NAMES xxxx"); 其中 xxxx 是你网页的编码(charset=xxxx),如果网页中 charset=utf8,则 xxxx=utf8,如果网页中 charset=gb2312,则xxxx=gb2312,几乎所有 WEB 程序,都有一段连接数据库的公共代码,放在一个文件里,在这文件里,加入 mysql_query("SET NAMES xxxx") 就可以了。
  SET NAMES 显示客户端发送的 SQL 语句中使用什么字符集。因此,SET NAMES 'utf-8' 语句告诉服务器“将来从这个客户端传来的信息采用字符集 utf-8”。它还为服务器发送回客户端的结果指定了字符集(例如,如果你使用一个 SELECT 语句,它表示列值使用了什么字符集)。
  定位问题时常用的技巧
  定位中文编码问题通常采用最笨的也是最有效的办法―在你认为有嫌疑的程序处理后打印字符串的内码。通过打印字符串的内码,你可以发现什么时候中文字符被转换成 Unicode,什么时候Unicode 被转回中文内码,什么时候一个中文字成了两个 Unicode 字符,什么时候中文字符串被转成了一串问号,什么时候中文字符串的高位被截掉了……
  取用合适的样本字符串也有助于区分问题的类型。如:"aa啊 aa?@aa" 等中英相间,GB、GBK特征字符均有的字符串。一般来说,英文字符无论怎么转换或处理,都不会失真(如果遇到了,可以尝试着增加连续的英文字母长度)。
  PHP脚本数据库功能详解分析
  在当前互联网发展迅速、电子商务网站层出不穷的形势下,对网站开发的效率和质量提出了越来越高的要求。
  对于大型和结构复杂、内容繁多的网站,都要实现网站的动态化和方便的管理。数据管理离不开数据库系统的支持。而衡量一种CGI语言的重要标志,就是它对后台数据库的访问能力、效率等。
  而目前流行的PHP脚本语言,它的新特性给我们带来了新的感觉。它支持以面向对象的方式进行设计开发。同时,为了满足网页独特的需要,用模板、XML支持等带来了网站开发的新方法。在语言结构上,PHP具有类似于C++语言的结构,并引入了类的概念,简化了开发。
  PHP还具有强大的数据库支持能力。我们这里就通过实例,首先介绍PHP访问数据库的一般流程,然后通过文件的数据库存储介绍PHP访问数据库的一种高级应用。最后通过数据库类的使用实例,介绍真正实用高效的数据库开发方法。
  PHP数据库功能简介
  PHP提供对10余种常见数据库的支持,如Oracle、dBase、Informix、SQL Server、Sysbase、MySQL等。正是由于广泛的数据库支持,才拓展了PHP的应用范围, 使得各种应用都可以利用PHP进行开发。
  在各种数据库中,MySQL由于其免费、跨平台、使用方便、访问效率较高,获得了很大的应用。很多中心型网站都使用PHP+MySQL这一最佳搭档。
  Oracle是典型的大型数据库应用系统。如果你设计的网站数据量大,性能、效率要求高的话,Oracle是个不错的选择。
  在Win32平台上,SQL Server占有较大的市场。PHP可以访问SQL Server。
  PHP对各种数据库的访问方法进行封装,针对不同数据库系统的函数也很相似,增加了使用的方便性。
  下面,我们将以一个简单的人才信息交流中心(见图1)为例子,编程实现个人简历的在线提交、浏览等功能,讲述PHP数据库操作的全过程。数据库采用最常用的MySQL数据库。
  PHP数据库操作基本步骤
  我们将在本地机器创建名为ResumeDB的数据库,数据库中有名为Resume的表。表中存储个人简历的编号、人员名称、个人简介,以及Word格式的简历文件等。
  1.数据库的创建
  切换至/usr/local/mysql/bin目录,在命令行,执行以下语句创建数据库:
  ./mysqladmin-u root-p create ResumeDB
  Enter password:
  在提示后输入密码。如果数据库是第一次使用,默认的密码为空,直接回车即可。
  然后创建保存个人简历的表。
  创建文本文件Resume.sql,内容如下:
  use ResumeDB;
  CREATE TABLE Resume (
  ID tinyint(4) NOT NULL auto_increment,
  Name varchar(10) NOT NULL,
  Intro varchar(255),
  ResuFile longblob,
  PRIMARY KEY (ID),
  KEY ID (ID)
  );
  将其放到My的可执行目录/usr/local/mysql/bin下,执行如下命令
  ./mysql-u root-p〈 Resume.sql
  Enter password:
  输入数据库密码后,表Resume自动创建成功。其中,ResuFile字段为longbolb型,用来存储二进制的Word文档。
  2.数据库访问流程
  PHP对数据库的访问一般包括下列步骤:连接数据库系统→选择数据库→执行SQL语句→关闭结果集→关闭数据库连接→结束。
  (1) 连接数据库
  连接数据库是建立用户程序到数据库系统的对话通道的过程。连接MySQL数据库的语句如下:
  <?
  $LinkID=@mysql_connect("localhost", "root" , "") or die
  ("不能连接到数据库服务器!可能是数据库服务器没有启动,或者用户名密码有误!");
  ?>
  其中,函数mysql_connect()用于与数据库服务器建立连接。三个参数分别为:数据库服务器的主机名(也可以是IP)、数据库用户名和用户密码。函数返回值用于表示这个数据库连接。
  从这个命令可以看到,我们可以指定并非本机的机器名作为数据库服务器。这样,就为数据的异地存放、数据库的安全隔离提供了可能。外界用户往往具有WWW服务器的直接访问权限,如果数据库系统直接放置在WWW服务器上,就可能会带来安全隐患。而如果将数据库系统放置于一台防火墙后面的计算机上,PHP可以通过局域网访问数据库,而局域网内部的计算机对外部是不可见的。这样,就保证了数据库不受外来攻击的可能。
  函数前面的“@”符号,用于限制这个命令的出错信息的显示。如果函数调用出错,将执行or后面的语句。die( )函数表示向用户输出引号中的内容后,程序终止执行。这样做是为了防止数据库连接出错时,用户看到一堆莫名其妙的专业名词,而是提示定制的出错信息。不过在调试的时候,我们还是可以不要屏蔽出错信息,免得出错后,难以找到到底哪里有问题。
  (2) 数据库选择
  一个数据库系统可以包含多个数据库。在建立了和数据库服务器的连接后,我们就要告诉系统,我们将要用到的数据库是哪个。选择数据库的命令如下:
  <?
  @mysql_select_db("ResumeDB",$LinkID) or die("选择数据库出错,可能是您指定的数据库不存在!");
  ?>
  选择数据库时,要提供的参数是数据库的名称、和服务器连接号。
  当我们只使用一台数据库服务器时,$LinkID可以省略,系统自动查找最近的一个数据库连接然后使用它。但是,当你要实现大型站点的时候,必不可少的要遇到多主机、多数据库系统的情况。这时,数据库连接参数就不能省略了。
  (3) 数据库访问
  好了,我们已经建立了到数据库的连接,选定了数据库,接下了来的一切就是执行SQL语句了。SQL语句的易用而强大的功能,将完成我们绝大部分的数据库操作动作。

上一篇:做PHP网站开发需要具备哪些技能

下一篇:PHP获取当前url的具体方法介绍