我正在尝试使用Python从字符串中删除特定字符。这是我现在正在使用的代码。不幸的是,它似乎对字符串没有任何作用。
for char in line: if char in " ?.!/;:": line.replace(char,'')
如何正确执行此操作?
Python中的字符串是不可变的(无法更改)。因此,的效果line.replace(...)只是创建一个新字符串,而不是更改旧字符串。你需要重新绑定(分配)到line该变量,以使该变量采用新值,并删除这些字符。
line.replace(...)
而且,相对而言,你的操作方式会比较缓慢。这也可能会使经验丰富的pythonator感到有些困惑,他们将看到双重嵌套的结构,并暂时认为会发生一些更复杂的事情。
从Python 2.6和更高版本的Python 2.x版本*开始,你可以改用str.translate,(但请继续阅读Python 3的不同之处):
str.translate
line = line.translate(None, '!@#$')
或用替换正则表达式 re.sub
import re line = re.sub('[!@#$]', '', line)
方括号内的字符构成一个字符类。line该类中的所有字符都将替换为第二个参数sub:空字符串。
在Python 3中,字符串是Unicode。你必须进行一些不同的翻译。kevpie在对其中一个答案的评论中提到了这一点,并在的文档中str.translate对此进行了注明。
Unicode
当调用translateUnicode字符串的方法时,你不能传递上面使用的第二个参数。你也不能None作为第一个参数传递。相反,你将翻译表(通常是字典)作为唯一参数传递。该表将字符的序号值(即调用ord它们的结果)映射到应替换它们的字符的序号值,或者(对我们有用)None表示应删除它们。
translateUnicode
因此,使用Unicode字符串进行上述舞蹈时,你会调用类似
translation_table = dict.fromkeys(map(ord, '!@#$'), None) unicode_line = unicode_line.translate(translation_table)
在此处dict.fromkeys和map用于简要生成包含以下内容的字典
dict.fromkeys
{ord('!'): None, ord('@'): None, ...}
就像另一个答案所说的那样,它更简单,在原位创建翻译表:
unicode_line = unicode_line.translate({ord(c): None for c in '!@#$'})
或使用创建相同的翻译表str.maketrans:
str.maketrans
unicode_line = unicode_line.translate(str.maketrans('', '', '!@#$'))
*为了与早期的Python兼容,你可以创建一个“空”转换表来代替None:
*
None
import string line = line.translate(string.maketrans('', ''), '!@#$')
这string.maketrans是用来创建转换表的,它只是一个字符串,其中包含序号为0到255的字符。
string.maketrans