Python学习笔记:pd.filter、query筛选数据

技术Python学习笔记:pd.filter、query筛选数据 Python学习笔记:pd.filter、query筛选数据一、pd.filter函数
1.介绍
pd.filter 函数根据指定的索引

计算机编程语言学习笔记:pd.filter、query筛选数据

一、pd.filter函数

1.介绍

pd.filter函数根据指定的索引标签对数据框行、或列进行数据筛选(子集查询)。

使用语法为:

数据框过滤器(项目=无,

像=无,-字符串

正则表达式=无,-字符串

轴=无)

类似于df.loc、df.iloc函数所实现的功能。

参数说明:

项目-对列进行筛选轴标签列表

regex -正则匹配

就像-进行筛选模糊名查询

轴=0 -按行

轴=1 -按列

注意:仅按照标签筛选,不对数据内容进行过滤!

2.pd.filter

# 构建测试集

进口熊猫作为螺纹中径

将numpy作为铭牌导入

df=pd .DataFrame(np.array(([1,2,3],[4,5,6])),

索引=['鼠标','兔子'],

列=['一','二','三'])

# 过滤列

df.filter(项目=['一','三'])

df.filter(['one'])

# 正则

df.filter(regex='e$ ',axis=1) #以e结尾

df.filter(regex='e$ ',axis=0)

df.filter(正则表达式='Q') #包含Q

# 相似

df.filter(如='bb ',轴=0) #按行

# 轴标签

df.filter(['一','二],轴=1)

# 混合使用

df.filter(regex='^r',轴=0)。过滤器(如='o ',轴=1) # r开头的行包含o的列

注意:其中的参数 items/like/regex 被强制执行为相互排斥,只能有一个存在。

3.pd.Series.filter

警局。系列应用过滤器时参数与df.filter一样,不过由于系列只有一个轴,不能将轴=1,只能按索引查询数据。

df.one.filter(['兔子'])

df.one.filter(如='e ')

df.one.filter(regex='e$ ')

4.DataFrameGroupBy.filter

分组后进行筛选,可以自定义函数,常与匿名函数希腊字母的第11个结合使用。

类似于结构化查询语言中的通过拥有操作。

使用语法为:

数据框架组副本。过滤器(func,dropna=True,*参数,**kwargs)

功能用于每个分组

dropna -是否删除

实操:

# 构建测试集

df=pd .DataFrame({'A' : ['foo ',' bar ',' foo ',' bar ',

foo ',' bar'],

B' : [1,2,3,4,5,6],

C' : [2.0,5 . 8. 1. 2. 9.]})

# 筛选分组后

df.groupby('A ').过滤器(lambda x:x['B'])。均值()3。)

# 长度

df.groupby("团队")。滤波器(x:透镜(x)=3)

# 只要有一个满足

df.groupby(['A']).过滤器(lambda x: (x['B'] 3).any())

# 全部满足

df.groupby('A ').过滤器(x :(x . mean()=4).all())

# 和满足

df.groupby('A ').滤波器(x : x Q1。总和(100)

二、pd.query函数

1.介绍

使用布尔表达式查询数据帧的列,按照某列规则进行过滤。

类似于结构化查询语言中的在哪里进行条件过滤。

使用语法为:

DataFrame.query(expr,inplace=False,**kwargs)

表达式查询字符串

就地-是否修改原数据框

2.实操

进口熊猫作为螺纹中径

将numpy作为铭牌导入

df=pd .DataFrame({'A':range(1,6),

b ' :范围(10,0,-2),

C':2})

df

'''

英国广播公司

0 1 10 2

1 2 8 2

2 3 6 2

3 4 4 2

4 5 2 2

'''

df.query('B==2') # B列等于2

df.query('A B') # A列小于B列

df[df .测向仪# B]#同上

# 多条件查询

df.query('A B A C ')

df.query('A B | A==4 ')

# 部分样例

df.query('A B C ')

df。查询(“a100”)

df.query('A==B ')

df.query('A!=100')

df。查询("[3,5]中的a”)

df.query('不在[3,5]中的a’)

df。查询(' name。字符串。包含(' r ')#好像不支持

df.name.str.contains('r') #测试没问题

df.query('B=='团队名称` ')#有空格反引号

注意:查询条件必须为字符串。

参考链接:熊猫过滤器筛选标签

参考链接:熊猫数据框.过滤器

参考链接:熊猫过滤器筛选标签

参考链接:熊猫过滤-过滤器函数,查询函数的使用

参考链接:熊猫-查询函数询问

参考链接:熊猫高级:查询方法教你优雅的查询

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/62062.html

(0)

相关推荐

  • 怎样修改支付宝支付密码,淘宝支付宝怎么修改密码

    技术怎样修改支付宝支付密码,淘宝支付宝怎么修改密码方法/步骤首先怎样修改支付宝支付密码,大家还是要使用自己的淘宝账户登录支付宝,登录支付宝账户的时候可以使用绑定的手机号或者是邮箱帐号,然后大家可以看看下面的图片。淘宝支付

    生活 2021年10月29日
  • 怎么解决MySQL server PID file could not be found问题

    技术怎么解决MySQL server PID file could not be found问题本篇内容介绍了“怎么解决MySQL server PID file could not be found问题”的有关知识,在

    攻略 2021年11月18日
  • 线性回归理解和应用例子

    技术线性回归理解和应用例子 线性回归理解和应用例子HaHa,没错又是作业...
    理解:
    线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
    这句话里的“相

    礼包 2021年11月22日
  • mysql从共享表空间修改为单个表的表空间存储方式是什么

    技术mysql从共享表空间修改为单个表的表空间存储方式是什么本篇文章为大家展示了mysql从共享表空间修改为单个表的表空间存储方式是什么,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收

    攻略 2021年11月16日
  • Python编程为什么不使用print调试代码了

    技术Python编程为什么不使用print调试代码了这篇文章主要介绍“Python编程为什么不使用print调试代码了”,在日常操作中,相信很多人在Python编程为什么不使用print调试代码了问题上存在疑惑,小编查阅

    攻略 2021年10月25日
  • MySQL varchar类型最大值是多少

    技术MySQL varchar类型最大值是多少本篇内容介绍了“MySQL varchar类型最大值是多少”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希

    攻略 2021年12月4日