从Python中的字符串中删除特定字符


从Python中的字符串中删除特定字符

Python中的字符串是不可变的(不能更改)。因此,line.replace(...)只是创建一个新字符串,而不是更改旧字符串。您需要重新绑定(赋值)它以line使该变量获取新值,并删除这些字符。

而且,你这样做的方式相对较慢。对于经验丰富的pythonator来说,这也有点令人困惑,他们会看到一个双重嵌套的结构,并想一想更复杂的事情正在发生。

从Python 2.6和更新的Python 2.x版本*开始,您可以使用str.translate,(但请继续阅读Python 3的差异):

line = line.translate(None, '!@#$')

或正则表达式替换 re.sub

import re
line = re.sub('[!@#$]', '', line)

括号中的字符构成一个字符类。line该类中的任何字符都将替换为第二个参数sub:空字符串。

调用translateUnicode字符串的方法时,不能传递我们上面使用的第二个参数。您也不能None作为第一个参数传递,甚至不能传递string.maketrans。而是将字典作为唯一参数传递。这个字典将字符的序数值(即调用ord它们的结果)映射到应该替换它们的字符的序数值,或者对我们有用None- 表示它们应该被删除。

所以要用Unicode字符串做上面的舞蹈,你会称之为

translation_table = dict.fromkeys(map(ord, '!@#$'), None)
unicode_line = unicode_line.translate(translation_table)

这里dict.fromkeysmap习惯于简洁地生成包含的字典

{ord('!'): None, ord('@'): None, ...}

更简单,正如另一个答案所说,创建字典:

unicode_line = unicode_line.translate({ord(c): None for c in '!@#$'})

*为了与早期的Pythons兼容,您可以创建一个“null”转换表来代替None:

import string
line = line.translate(string.maketrans('', ''), '!@#$')