全网整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:400-708-3566

PHP 与 UTF-8 的最佳实践详细介绍

《PHP中的字符串、编码、UTF-8》一文中描述了一些列的基础知识,比较枯燥,现在来说点有用的——PHP 字符串处理的最佳实践,本文是“PHP、字符串、编码、UTF-8”相关知识的第二部分。先说结论—— 在 PHP 中的各个方面使用 UTF-8 编码。

PHP 语言层面是不支持 Unicode字符集的,但是可以通过 UTF-8 编码能处理大部分问题。

最佳实践就是明确知道输入编码(不知道就检测),内部统一转换为 UTF-8 编码,输出编码也统一是 UTF-8编码。

PHP 层面如何处理 UTF-8

当操作 Unicode 字符集的时候,请务必安装 mbstring 扩展,并使用相应的函数代替原生的字符串函数。举个例子,一个文件编码为 UTF-8 的 PHP 代码,假如使用 strlen() 函数是错误的,请使用 mb_strlen() 函数代替。

mbstring 扩展大部分的函数都需要基于一个编码(内部编码)来处理,请务必统一使用 UTF-8 编码,这个大部分可以在 PHP.INI 中配置。

从 PHP 5.6 开始,default_charset 配置可以替换 mbstring.http_input,mbstring.http_output 。

另外一个重要的配置就是 mbstring.language,这个默认值是 Neutral(UTF-8)。

注意文件编码和 mbstring 扩展的内部编码不是同一个概念。

概括的说来:

  • PHP.INI 中涉及到 mbstring 扩展的部分尽量使用 UTF-8。
  • 请用 mbstring 扩展函数代替原生字符串操作函数。
  • 在使用相关函数的时候,请务必了解你操作的字符的编码是什么,在使用对应函数的时候,显示的写上 UTF-8 编码参数,比如 htmlentities() 函数的第三个参数显示写上 UTF-8。

文件 IO 操作 如何处理 UTF-8

这里举个例子,假如你要打开一个文件,但是不知道文件内容是什么编码的,那么如何处理呢?

最佳实践就是,在打开的时候统一转换成 UTF-8,修改内容后就再转回原来的编码并保存到文件。看代码把:

if ( mb_internal_encoding()!="UTF-8") {
    mb_internal_encoding("UTF-8");
}

$file = "file.txt"; //一个编码为gbk的中文文件
$str= file_get_contents($file);
//不管来源是什么编码,统一显示的时候转换为 UTF-8
 if (mb_check_encoding($str,"GBK")) 
  $str = mb_convert_encoding($str,"UTF-8",“GBK”); 

$str ="修改内容";
$str = mb_convert_encoding($str,$srcbm,"UTF-8"); //原样转回去
file_put_contents($file,$str);

Mysql 和 UTF-8 的最佳实践

这个相对简单,首先保证你的 Mysql 都是 UTF-8。然后 Mysql 客户端连接的时候也保持 UTF-8,具体到 PHP 中,就是 imysql 或者 PDO 扩展连接 Mysql 的时候都设置 UTF-8 作为连接编码,二边保持一致,一般就不会遇到问题。

浏览器和 UTF-8 的最佳实践

这个也比较简单,就是你的输出内容假如是网页,那么你的字符串处理输出最总请保持为 UTF-8 ;同时 PHP.INI 中也明确设定 default_charset 为 UTF-8;HTML 的 Meta Tag 也明确标识为 UTF-8。

现在万事大吉了吗,并没有,虽然服务器和浏览器让用户使用 UTF-8 编码,但是用户的行为并没有约束性,他可能输入的是其他编码的字符,或者上传的文件名是其他编码的字符,那么怎么办呢?可以通过 mb_http_input() 和 mb_check_encoding() 函数来检测用户的编码,然后内部转换为 UTF-8。确保在任何一个层面,最终处理的是 UTF-8 编码。换句话说,需要手段能够知晓你的输入是什么编码的,处理完成后控制输出的编码是 UTF-8。

不建议使用 mbstring.encoding_translation 指令 和 mb_detect_encoding() 函数。折磨我半天。

操作系统和 UTF-8 的最佳实践

由于操作系统的原因,PHP 处理 Unicode 文件名的时候会有不同的处理机制。

在 Linux 中,文件名始终是 UTF-8 编码的,而在中文 Windows 环境下,文件名始终是 GBK 编码的,记住这一点就可以了。

通过例子说明下:

//命令行程序函数,运行在中文版 Windows 10 操作系统 ,文件编码为 UTF-8

function filenameexample() {
  $filename = "测试.txt" ;
  $gbk_filename = iconv("UTF-8","GBK",$filename);
  file_put_contents($gbk_filename, "测试");
  echo file_get_contents($gbk_filename);
}

function scandirexample() {
  $arr = scandir("./tmp");
  foreach ($arr as $v) {
    if ($v == "." || $v =="..")
      continue ;
    $filename = iconv( "GBK","UTF-8",$v ) ;
    $content = file_get_contents("./tmp/" . $v );
  }
}

假如不想写写兼容 Windows 和 linux 的程序,可以对文件名进行 urlencode 编码,比如:

function urlencodeexample() {
  $filename = "测试2.txt" ;
  $urlencodefilename = urlencode($filename) ;
  file_put_contents($urlencodefilename, "测试");
  echo file_get_contents($urlencodefilename);
 }

在用 PHP 通过 header() 函数下载文件的时候,也要考虑浏览器和操作系统(大部分人使用的是 Windows),对于 Chrome 来说,输出的文件名编码可以是 UTF-8,Chrome 会自动将文件名转换为 GBK 编码。

而对于低版本的 IE 来说,它继承了操作系统的环境,所以下载文件名假如是中文必须转码为 UTF-8 编码,否则下载的时候用户看到的是乱码文件名。通过代码来说明:

$agent=$_SERVER["HTTP_USER_AGENT"];
if(strpos($agent,'MSIE')!==false {
  $filename = iconv("UTF-8","GBK","附件.txt");
  header("Content-Disposition: attachment; filename=\"$filename\"");
}

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!


# PHP  #   # UTF-8  # 的最佳实践  # 使用详解  # PHP iconv 解决utf-8和gb2312编码转换问题  # PHP乱码问题  # UTF-8乱码常见问题小结  # php中utf-8编码下用正则表达式如何匹配汉字  # php中隐形字符65279(utf-8的BOM头)问题  # php中json_encode UTF-8中文乱码的更好解决方法  # php utf-8转unicode的函数  # PHP utf-8编码问题  # utf8编码  # 数据库乱码  # 页面显示输出乱码  # php中文乱码怎么办如何让浏览器自动识别utf-8  # PHP 截取字符串函数整理(支持gb2312和utf-8)  # php UTF-8、Unicode和BOM问题  # jq的get传参数在utf-8中乱码问题的解决php版  # PHP如何实现Unicode和Utf-8编码相互转换  # php smarty截取中文字符乱码问题?gb2312/utf-8  # 的是  # 转换为  # 操作系统  # 如何处理  # 可以通过  # 请务必  # 写上  # 举个例子  # 都是  # 会有  # 你要  # 也要  # 一是  # 万事大吉  # 而在  # 半天  # 希望能  # 请使用  # 不支持  # 任何一个 


相关文章: 已有域名如何快速搭建专属网站?  电脑免费海报制作网站推荐,招聘海报哪个网站多?  c# 在高并发下使用反射发射(Reflection.Emit)的性能  SAX解析器是什么,它与DOM在处理大型XML文件时有何不同?  番禺网站制作公司哪家值得合作,番禺图书馆新馆开放了吗?  网站制作怎么样才能赚钱,用自己的电脑做服务器架设网站有什么利弊,能赚钱吗?  成都网站制作价格表,现在成都广电的单独网络宽带有多少的,资费是什么情况呢?  官网网站制作腾讯审核要多久,联想路由器newifi官网  婚礼视频制作网站,学习*后期制作的网站有哪些?  建站主机系统SEO优化与智能配置核心关键词操作指南  制作网站的软件下载免费,今日头条开宝箱老是需要下载怎么回事?  如何在IIS7上新建站点并设置安全权限?  学校免费自助建站系统:智能生成+拖拽设计+多端适配  怎么制作一个起泡网,水泡粪全漏粪育肥舍冬季氨气超过25ppm,可以有哪些措施降低舍内氨气水平?  北京专业网站制作设计师招聘,北京白云观官方网站?  制作假网页,招聘网的薪资待遇,会有靠谱的吗?一面试又各种折扣?  如何在宝塔面板创建新站点?  建站之星后台管理如何实现高效配置?  如何选择CMS系统实现快速建站与SEO优化?  建站168自助建站系统:快速模板定制与SEO优化指南  已有域名和空间,如何快速搭建网站?  如何撰写建站申请书?关键要点有哪些?  如何选择高性价比服务器搭建个人网站?  建站之星代理如何优化在线客服效率?  c++23 std::expected怎么用 c++优雅处理函数错误返回【详解】  如何用wdcp快速搭建高效网站?  如何高效生成建站之星成品网站源码?  建站之星如何通过成品分离优化网站效率?  公司门户网站制作公司有哪些,怎样使用wordpress制作一个企业网站?  最好的网站制作公司,网购哪个网站口碑最好,推荐几个?谢谢?  建站主机服务器选型指南与性能优化方案解析  制作网站外包平台,自动化接单网站有哪些?  家族网站制作贴纸教程视频,用豆子做粘帖画怎么制作?  python的本地网站制作,如何创建本地站点?  如何高效完成独享虚拟主机建站?  如何设置并定期更换建站之星安全管理员密码?  ,石家庄四十八中学官网?  股票网站制作软件,网上股票怎么开户?  如何在宝塔面板中创建新站点?  如何在腾讯云服务器快速搭建个人网站?  如何选择PHP开源工具快速搭建网站?  小说建站VPS选用指南:性能对比、配置优化与建站方案解析  Python路径拼接规范_跨平台处理说明【指导】  如何通过VPS建站无需域名直接访问?  linux top下的 minerd 木马清除方法  用v-html解决Vue.js渲染中html标签不被解析的问题  制作国外网站的软件,国外有哪些比较优质的网站推荐?  家庭建站与云服务器建站,如何选择更优?  装修招标网站设计制作流程,装修招标流程?  车管所网站制作流程,交警当场开简易程序处罚决定书,在交警网站查询不到怎么办? 

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。