一尘不染

存储数据的奇怪字符编码,旧脚本正在向他们展示好的新脚本没有

mysql

我正在尝试重写一个旧网站。
它是波斯语,使用波斯/阿拉伯字符。

CREATE DATABASE `db` DEFAULT CHARACTER SET utf8 COLLATE utf8_persian_ci;
USE `db`;

几乎所有我的表/列COLLATE都设置为 utf8_persian_ci

我正在为我的新脚本使用codeigniter,我有

'char_set' => 'utf8',
'dbcollat' => 'utf8_persian_ci',

在数据库设置中,因此没有问题。

所以这是奇怪的部分

旧的脚本正在使用某种称为TUBADBENGINETUBA DB ENGINE… 的数据库引擎,没什么特别的。

当我使用旧脚本在波斯语数据库中输入某些数据时,当我查看数据库时,字符存储为عمران

旧脚本获取/显示该数据很好,但是新脚本显示它们具有与数据库相同的奇怪字体/字符集

因此,当我输入时اااا,数据库存储的数据看起来像是عمراÙ,当我在新脚本中获取数据عمراÙ但在旧脚本中获取数据时,
اااا

CREATE TABLE IF NOT EXISTS `tnewsgroups` (
  `ID` int(11) NOT NULL AUTO_INCREMENT,
  `fName` varchar(200) COLLATE utf8_persian_ci DEFAULT NULL,
  PRIMARY KEY (`ID`)
) ENGINE=InnoDB  DEFAULT CHARSET=utf8 COLLATE=utf8_persian_ci AUTO_INCREMENT=11 ;

--
-- Dumping data for table `tnewsgroups`
--

INSERT INTO `tnewsgroups` (`ID`, `fName`) VALUES
(1, 'عمران'),
(2, 'معماری'),
(3, 'برق'),
(4, 'مکانیک'),
(5, 'test'),
(6, 'test2');

另一方面,当我ااااا直接输入数据库时

当然我有相同的اااا存储在数据库中

新脚本显示得很好

但是在旧脚本中我得到了 ????

任何人都可以理解吗?

这是大号引擎

https://github.com/maxxxir/mz-codeigniter-
crud/blob/master/tuba.php

旧脚本的用法示例:

define("database_type" , "MYSQL");
define("database_ip" , "localhost");
define("database_un" , "root");
define("database_pw" , "");
define("database_name" , "nezam2");
define("database_connectionstring" , "");
$db = new TUBADBENGINE(database_type , database_ip , database_un , database_pw , database_name , database_connectionstring);
$db->Select("SELECT * FROM tnews limit 3");
if ($db->Lasterror() != "") { echo "<B><Font color=red>ÎØÇ ! áØÝÇ ãÌÏøÏÇ ÊáÇÔ ˜äíÏ";  exit(); }
for ($i = 0 ; $i < $db->Count() ; $i++) {
    $row = $db->Next();
    var_dump($row);
}

阅读 306

收藏
2020-05-17

共1个答案

一尘不染

简而言之,因为这已经被讨论了上千次了:

  1. PHP拥有一个"漢字"以UTF-8编码的字符串,例如。的字节为E6 BC A2 E5 AD 97
  2. 它通过 设置为latin1数据库连接 发送此字符串。
  3. 数据库接收字节E6 BC A2 E5 AD 97,认为这些字节代表latin1字符。
  4. 数据库存储字符æ¼¢å­E6 BC A2 E5 AD 97映射到中的字符latin1)。
  5. 反向执行相同的过程会使PHP接收相同的字节,然后将其视为UTF-8。即使数据库未按应有的方式对待字符,往返也适用于PHP。

因此,这里的问题是,当将数据输入数据库时​​,数据库连接设置不正确。您必须将数据库中的数据转换为正确的字符。尝试这个:

SELECT CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) FROM table_name

utf8尝试一下,也许这不是您所需要的。如果可行,UPDATE请将其更改为语句以永久更新数据。

2020-05-17