python选取特定列——pandas的iloc和loc以及icol使用（列切片及行切片）

xiaoxiao2021-02-28 20

df是一个dataframe，列名为A B C D 具体值如下： A B C D 0 ss 小红 8 1 aa 小明 d 4 f f 6 ak 小紫 7 dataframe里的属性是不定的，空值默认为NA。一、选取标签为A和C的列，并且选完类型还是dataframe df = df.loc[:, ['A', 'C']] df = df.iloc[:, [0, 2]] 二、选取标签为C并且只取前两行，选完类型还是dataframe df = df.loc[0:2, ['A', 'C']] df = df.iloc[0:2, [0, 2]] 聪明的朋友已经看出iloc和loc的不同了：loc是根据dataframe的具体标签选取列，而iloc是根据标签所在的位置，从0开始计数。 "，"前面的"："表示选取整列，第二个示例中的的0:2表示选取第0行到第二行，这里的0:2相当于[0,2）前闭后开，2是不在范围之内的。需要注意的是，如果是df = df.loc[0:2, ['A', 'C']]或者df = df.loc[0:2, ['A', 'C']]，切片之后类型依旧是dataframe，不能直接进行加减乘除等操作的，比如dataframe的一列是数学成绩(shuxue)，另一列为语文成绩(yuwen)，现在需要求两门课程的总和。可以使用df['shuxue'] + df['yuwen']（选取完之后类型为series）来获得总分，而不能使用df.iloc[:,[2]]+df.iloc[:,[1]]或 df.iloc[:,['shuxue']]+df.iloc[:,['yuwen']]，这会产生错误结果。还有一种方式是使用df.icol(i)来选取列，选取完的也不是dataframe而是series，i为该列所在的位置，从0开始计数。如果你想要选取某一行的数据，可以使用df.loc[[i]]或者df.iloc[[i]]。

转载请注明原文地址: https://www.6miu.com/read-2050022.html

技术

最新回复(0)