一尘不染

修复损坏的UTF-8编码

mysql

我正在修复一些错误的UTF-8编码。我目前正在使用PHP 5和MySQL。

在我的数据库中,我有一些编码错误的实例,例如:ƒ

  • 数据库整理是utf8_general_ci
  • PHP使用的是正确的UTF-8标头
  • Notepad ++设置为使用不带BOM的UTF-8
  • 数据库管理在phpMyAdmin中处理
  • 并非所有重音符号的情况都被破坏

我需要某种函数来帮助我将ƒ,®,?,?¼和其他类似的实例映射到其适当的带重音的UTF-8字符。


阅读 579

收藏
2020-05-17

共1个答案

一尘不染

过去,我不得不尝试“修复”许多UTF8损坏的情况,但是不幸的是,这绝非易事,而且常常是不可能的。

除非您能确切确定它是如何破裂的,而且总是以完全相同的方式破裂,否则将很难“消除”损坏。

如果要尝试消除损害,最好的选择是开始编写一些示例代码,在该示例中,尝试对mb_convert_encoding()的调用进行多种变体,以查看是否可以找到“
from”和“ to”的组合修复您的数据。最后,通常最好不要再因为涉及到痛苦的程度而担心修复旧数据,而只是去解决将来的问题。

但是,在执行此操作之前,您需要确保首先解决导致此问题的所有问题。您已经提到数据库表排序规则和编辑器设置正确。但是,还有更多地方需要检查以确保所有内容都正确地是UTF-8:

  • 确保您将HTML用作UTF-8:
    • header(“ Content-Type:text / html; charset = utf-8”);
  • 将您的PHP默认字符集更改为utf-8:
    • ini_set(“ default_charset”,’utf-8’);
  • 如果您的数据库始终不能使用utf-8进行通信,那么您可能需要基于每个连接告诉它,以确保它处于utf-8模式,在MySQL中,您可以通过发出以下命令来做到这一点:
    • 字符集utf8
  • 您可能需要告诉您的网络服务器始终尝试使用UTF8进行对话,在Apache中,此命令是:
    • 添加默认字符集UTF-8
  • 最后,您需要始终确保您使用的是正确的UTF-8抱怨的PHP函数。这意味着始终使用mb_ *样式的“多字节感知”字符串函数。这也意味着在调用诸如htmlspecialchars()之类的函数时,应在末尾包含适当的’utf-8’charset参数,以确保其不会对它们进行错误编码。

如果您错过了整个过程中的任何一步,则编码可能会被破坏并且会出现问题。一旦您进入执行utf-8的“槽”,这一切便成为第二天性。当然,PHP6应该是来自getgo的完全unicode投诉,这将使很多事情变得更容易(希望如此)

2020-05-17