一尘不染

Python-从pandas数据框中按部分字符串选择

python

我有一个DataFrame4列,其中2个包含字符串值。我想知道是否有一种方法可以根据针对特定列的部分字符串匹配来选择行?

换句话说,一个函数或lambda函数将执行以下操作

re.search(pattern, cell_in_question)

返回一个布尔值。我熟悉的语法,df[df['A'] == "hello world"]但似乎无法找到一种使用部分字符串匹配说的方法'hello'

有人可以指出正确的方向吗?


阅读 1147

收藏
2020-02-09

共1个答案

一尘不染

基于github问题#620,看来你很快将能够执行以下操作:

df[df['A'].str.contains("hello")]

更新:熊猫0.8.1及更高版本中提供了向量化字符串方法(即Series.str)

2020-02-09