【pandas教程】pandas.read_excel()函数usecols参数详解

2021/07 31 18:07
阅读(3927)

当我们用pandasread_excel读取excel数据时,会遇到excel工作表里有非常多的列,但我们在做数据分析时可能只需要用到其中的部分列。这个时候就需要用到read_excelusecols参数(Usecols是use columns的缩写),用来指定read_excel读取excel表时只读取usecols指定列的数据。Usecols参数的值有以下四种形式:

  • None:全部(默认)
  • Str:’a,c’,’a,c:e’ 使用列号
  • Int-list:[0,2] 使用列索引
  • Str-list:[‘AAA’,’ccc’] 使用数据表的表头字段
usecols参数

usecols参数第1种:None(不写usecols时,默认值),表示读取全部列,例如有一个表usecols.xlsx,表中数据如上图。

 
dt=pd.read_excel(r'usecols.xlsx',usecols=None)#等同于dt=pd.read_excel(r'usecols.xlsx')

读取usecols表的结果如下:

usecols-01
usecols默认参数None

usecols参数第2种: Str:’a,c’,’a,c:e’ 使用EXCEL的列号,字符串类型,不区分大小写。

 
pd.read_excel(r'usecols.xlsx',usecols='a,c:d') #写成usecols='A,C:D'效果等同
usecols-02
usecols参数为str列号

usecols参数第3种: Int-list:[0,2] 使用列索引,一个列表,里面是列索引的数字,从0开始。

 
pd.read_excel(r'usecols.xlsx',usecols=[0,1,2])
usecols-03
usecols参数为int列索引

usecols参数第4种: Str-list:[‘AAA’,’ccc’]使用数据表的表头字段。这里遇到了一个小BUG,如果使用这种方法没有读取出来,但又不报错,需要更新下pandas库,就可以了。

 
pd.read_excel(r'usecols.xlsx',usecols=['姓名','3月'])
usecols-04
usecols参数为str表头

以上就是pandas读取excel所用的read_excel()函数参数usecols的4种常用方法,另外还有一种就是用lambda函数遍历列,lambda x:x=”1月”,这里不在举例,感兴趣的伙伴可以自己尝试下。希望本节内容对于在数据分析路上的你有所帮助。

o郭二爷o原创或整理--转载请注明: https://www.dszhp.com/read_excel_usecols.html

发表回复

欢迎回来 (打开)

(必填)