这似乎是一个非常简单的问题……但是我没有看到我期望的简单答案。
那么,如何获得Pandas中给定列的第n行的值?(我对第一行特别感兴趣,但也对更通用的做法也很感兴趣)。
例如,假设我想将Btime中的1.2值作为变量。
什么是正确的方法?
df_test =
ATime X Y Z Btime C D E 0 1.2 2 15 2 1.2 12 25 12 1 1.4 3 12 1 1.3 13 22 11 2 1.5 1 10 6 1.4 11 20 16 3 1.6 2 9 10 1.7 12 29 12 4 1.9 1 1 9 1.9 11 21 19 5 2.0 0 0 0 2.0 8 10 11 6 2.4 0 0 0 2.4 10 12 15
要选择该ith行,请使用iloc:
ith
iloc
In [31]: df_test.iloc[0] Out[31]: ATime 1.2 X 2.0 Y 15.0 Z 2.0 Btime 1.2 C 12.0 D 25.0 E 12.0 Name: 0, dtype: float64
要在Btime列中选择第i个值,可以使用:
Btime
In [30]: df_test['Btime'].iloc[0] Out[30]: 1.2
df_test['Btime'].iloc[0]
df_test.iloc[0]['Btime']
DataFrame将数据存储在基于列的块中(每个块具有一个dtype)。如果首先按列选择,则可以返回 视图 (比返回副本要快),并且保留原始dtype。相反,如果首先选择按行,并且DataFrame的列具有不同的dtype,则Pandas将数据 复制 到新的Object dtype系列中。因此,选择列比选择行要快一些。因此,尽管df_test.iloc[0]['Btime']有效,但 df_test['Btime'].iloc[0]效率更高。
在分配方面,两者之间存在很大差异。 df_test['Btime'].iloc[0] = x影响df_test,但df_test.iloc[0]['Btime'] 可能不会。有关原因的说明,请参见下文。由于索引顺序的细微差别会在行为上产生很大差异,因此最好使用单个索引分配:
df_test['Btime'].iloc[0] = x
df_test
df.iloc[0, df.columns.get_loc('Btime')] = x
为DataFrame分配新值的 推荐方法 是避免链接索引,而应使用andrew所示的方法,
df.loc[df.index[n], 'Btime'] = x
要么
df.iloc[n, df.columns.get_loc('Btime')] = x
后一种方法要快一些,因为df.loc必须将行标签和列标签转换为位置索引,因此,如果改用,df.iloc则转换的必要性要少一些 。
df.loc
df.iloc
df['Btime'].iloc[0] = x
尽管这可行,但它利用了 当前 实现DataFrames的方式。不能保证熊猫将来会以这种方式工作。特别是,它利用了以下事实:(当前)df['Btime']始终返回视图(而不是副本),因此df['Btime'].iloc[n] = x可用于在的列的第n个位置 分配 新值。Btime``df
df['Btime']
df['Btime'].iloc[n] = x
Btime``df
由于Pandas无法明确保证索引器何时返回视图还是副本,因此使用链式索引的赋值通常会产生,SettingWithCopyWarning即使在这种情况下,赋值可以成功修改df:
SettingWithCopyWarning
df
In [22]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1]) In [24]: df['bar'] = 100 In [25]: df['bar'].iloc[0] = 99 /home/unutbu/data/binky/bin/ipython:1: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy self._setitem_with_indexer(indexer, value) In [26]: df Out[26]: foo bar 0 A 99 <-- assignment succeeded 2 B 100 1 C 100
df.iloc[0]['Btime'] = x
相比之下,with的分配df.iloc[0]['bar'] = 123不起作用,因为df.iloc[0]正在返回副本:
df.iloc[0]['bar'] = 123
df.iloc[0]
In [66]: df.iloc[0]['bar'] = 123 /home/unutbu/data/binky/bin/ipython:1: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy In [67]: df Out[67]: foo bar 0 A 99 <-- assignment failed 2 B 100 1 C 100
警告 :我之前曾建议过df_test.ix[i, 'Btime']。但这不能保证为您提供ith值,因为在尝试按 位置 索引之前先尝试ix按 标签 索引。因此,如果DataFrame的整数索引不是从0开始的排序顺序,则using将返回 标有标签 的行,而不是该行。例如, ix[i] i``ith
df_test.ix[i, 'Btime']
ix
ix[i]
i``ith
In [1]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1]) In [2]: df Out[2]: foo 0 A 2 B 1 C In [4]: df.ix[1, 'foo'] Out[4]: 'C'