真的哭死,后悔没早点刷Pandas速查表。
Python 是开源的,它很棒,但是也无法避免开源的一些固有问题:很多包都在做(或者在尝试做)同样的事情。如果你是 Python 新手,那么你很难知道某个特定任务的最佳包是哪个,你需要有经验的人告诉你。工欲善其事,必先利其器。
有一个用于数据科学的包绝对是必需的,它就是 Pandas。
虽然 Pandas 的功能十分强大刚开始接触Pandas的时候,谁都会感到难以记住那些常用的方法和类,所以有个速查表就很好。
给大家分享一份“小抄”下面我们就来看看这份小抄(速查表) 的强大。
【文末领取】表格内容概述:这两张图片一共归纳了 13 类常用的 Pandas 操作,下面我们就来简单看一看。1、数据创建介绍了几种常用的 DataFrame 创建语法2、数据重塑这部分主要是一些在数据清洗中常用的方法,比如数据连接、数据排序、数据删除等,并且还对四个常用的操作给出了图示,理解起来简直不要太方便。
3、数据筛选这一块区域主要是分别用行 / 列来讲解一些常用的数据查看、抽样、切片等操作,包含了tail、head、loc、iloc等非常重要的方法,并且同样给出了部分动画便于理解4、数据探索这一块主要给出了一些在进行探索性分析时常用的方法,比如max、min、count等,不过官方将 apply 放在这里,并没有展开讲解5、数据修改这两个区域为缺失值处理和创建新的列,重点用动画示例了assign和qcut方法,缺失值处理6、数据分组主要就是groupby和相关方法7、数据连接这里介绍的还是非常详细。
用图片例子来展示pd.merge中的各种参数变化的不同,一看就懂8、绘制图表绘制可视化图表是 Pandas 的一个重要功能。不过受限于篇幅,官方在这里仅仅是一笔带过。这份速查表(中文版)一共有两页,分为基础版和进阶版。如下图这是一份提纲挈领的“学习线索”,为你理清思路,指明方向。但是仅仅靠着两张图片是不可能把所有内容就弄明白的,它更像是我们考试前划的“复习重点”。通过这两张表,我们可以了解哪些操作可以用Pandas完成,以及在你不确定用什么方法处理数据时,快速查到Pandas中的哪个函数可以做到。【领取方式】
0 评论