一尘不染

如何在Python中处理多字节字符串

python

PHP中有多字节字符串函数来处理多字节字符串(例如:CJK脚本)。例如,我想通过使用lenpython中的函数来计算一个多字节字符串中有多少个字母,但是它返回的结果不准确(即该字符串中的字节数)

japanese = "桜の花びらたち"
print japanese
print len(japanese)#return 21 instead of 7

PHP中有像mb_strlen这样的软件包或函数吗?


阅读 288

收藏
2021-01-20

共1个答案

一尘不染

使用Unicode字符串

# Encoding: UTF-8

japanese = u"桜の花びらたち"
print japanese
print len(japanese)

注意u字符串前面。

要将字节字符串转换为Unicode,请使用decode"桜の花びらたち".decode('utf-8')

2021-01-20