【pandas教程】pandas.read_excel()函数usecols参数详解
阅读(5768)
当我们用pandas的read_excel读取excel数据时,会遇到excel工作表里有非常多的列,但我们在做数据分析时可能只需要用到其中的部分列。这个时候就需要用到read_excel的usecols参数(Usecols是use columns的缩写),用来指定read_excel读取excel表时只读取usecols指定列的数据。
当我们用pandas的read_excel读取excel数据时,会遇到excel工作表里有非常多的列,但我们在做数据分析时可能只需要用到其中的部分列。这个时候就需要用到read_excel的usecols参数(Usecols是use columns的缩写),用来指定read_excel读取excel表时只读取usecols指定列的数据。
在现实过程中,excel存储着各种各样的表格数据,每个表的表头(标题)也不一样,有的是一行标题,有的是多行标题,所以利用pandas的read_excel()读取excel表格时,需要通过header参数和index_col参数来指列索引和行索引。
pandas.read_excel()函数的sheet_name参数,用来指定要从excel中读取哪个表格的数据,sheet_name的值可以为None、string、int、字符串列表或整数列表,默认为0。字符串(string)用于工作表名称,整数(int)用于零索引工作表位置,字符串列表或整数列表用于请求多个工作表,为None时获取所有工作表。
pandas提供了read_excel函数来支持读取excel表里的数据,可以读取”xls”的excel文件,也可以读取”xlsx”类型的文件。read_excel函数功能强大,参数众多,我们并不定要掌握其全部的参数用法,但常用的参数还是需要了解,这样在操作EXCEL的时候才能做到游刃有余。
利用xlwings往excel中写入数据是我们常用的操作了,xlwings能够非常方便的向Excel文件中的写入数据。我们可以通过常量直接给单元格或单元格区域进行赋值,也可以利用xlwings写入一个二维列表(list)或者列表(list)类型的数据,还可以写公式,跟我们平时在excel中写入的公式效果一样。
前面介绍了利用python的xlwings库对excel进行新建、打开及对工作表、单元格区域等操作,本篇这里介绍利用xlwings对excel进行字体(font)、边框(border)、合并(merge)单元格等excel格式的设置,让生成的表格更加漂亮。
利用tkinter+googletrans+pyinstaller三个库简单的40多行代码就可以制作一个属于自己的翻译器,可以支持100多种语言的翻译。
对经常敲代码的人来说,给自己找一个顺手的代码编辑器很重要。python自带的IDE有点丑,而且功能过于单一,写写简单的命令可以。对于新手我推荐sublime text3。Sublime text 是开发者中最流行的编辑品之一,界面优美,多功能,支持多语言。有代码缩略图,Python的插件,代码段等实用功能,体积小巧,功能强大。
做为干数据分析的,数据可视化是必备的技能,最近经常在网上看到动态排名条形图,这种动态排名条形图能很好的表达在某一个时间周期,随着时间的变化,各参数指标的增减变化,形象直观,让人很容易理解。
python列表推导式可以简化for循环迭代列表,可以减少代码量,使用程序更加简洁。 python列表推导式可以利用 range 区间、元组、列表、字典和集合等数据类型,快速生成一个满足指定需求的列表。