GoogleSearchConsole正则表达搜索实操分享

2021年4月,Google Search Console的Performance报告筛选增加了对正则表达式的支持,6月初又新增了否定的选项,支持直接排除符合正则条件的页面。应该很多SEO运营人员都关注到了这一功能更新,但是可能因为对正则不太熟悉,未能充分利用这个功能来促进Google Search Console的数据分析工作。


因此,本文分享了一些大家可能会用到的正则表达式,不熟悉如何写表达式的人也能轻松体验这个功能。


目前Google Search Console的Performance报告下的“Page”及“Query”报告支持使用正则表达(RegEx)筛选,点击下图中的New按钮,在下拉菜单中可以选择这两个报告。

GoogleSearchConsole正则表达搜索实操分享


根据需要筛选的是关键词还是页面,选择对应的报告,之后,就可以输入正则条件进行筛选了。

GoogleSearchConsole正则表达搜索实操分享


操作过程其实是比较简单的,但是如果对于不熟悉正则表达式的人而言,就没法利用好这个高级版的筛选功能。


下面给大家介绍一些独立站运营人员经常使用到的筛选条件以及对应的正则表达式如何撰写,大家可以根据需要复制后稍作修改就能完成自身网站的数据筛选分析。


1. 筛选包含某个词的关键词或者页面

筛选包含某个词的关键词或者页面,在这个词前后用.*。例如,需要搜索包含pro的词,正则的写法是.*pro.*。


2. 筛选多个特定的页面

如果需要筛选多个页面,URL相同的部分可以只写一次,后面的文件路径使用 | 进行连接,例如:

^https://crossborderdigital.cn/(google-seo|orm-service/sem-service)/ $


表达式符号说明:

  • ^ 表示开始

  • ()表示将一系列元素组合在一起

  • | 表示或的意思,满足其中一个条件即可

  • $ 表示结束


3. 否定筛选

Google Search Console的支持正则表达式否定筛选,直接选择Doesn’t match regex即可,下面的正则表达式跟非否定筛选写法一致,如需要筛选不包含pro的词,如下图:


4. 指定关键词字符数进行筛选

如果需要直接查看网站非长尾关键词来源,可以选择字符数少于10的关键词(也可以更长字符数),正则表达式的写法是:^[\w\W\s\S]{1,10}$,那么,符合这一条件的关键词就能快速被筛选出来,超过10个字符数的长尾关键词将被排除。


正则表达式符号说明:

  • ^ 表示开始

  • [ ] 匹配字符数长度

  • \w 表示匹配任何大小写字母,数字以及下划线。等同于[A-Za-z0-9_]\g

  • \s 表示空格

  • \W 表示匹配非字母,数字及下划线

  • \S 表示匹配任何非空格

  • {1,10} 表示前面的规则重复1-10次

  • $ 表示结束


注意,如果觉得这个表达式的符号太多不容易记住,可以直接复制上面的样例,[\w\W\s\S]整体的意思就是匹配任意字符,因此只需要修改{1,10}来调整限定的字符数长度。


5. 筛选长尾关键词

筛选长尾关键词,可以选择按照字符数长度筛选,例如要搜索字符数大于40的长尾词,对应的正则表达是:^[\w\W\s\S]{40,}$


正则表达式符号说明:

  • ^ 表示开始

  • [\w\W\s\S] 表示匹配任何字符,拆分的符号对应意义见上文第四点。

  • {40,} 表示重复40次及以上

  • $ 表示结束


筛选长尾关键词的方法还有一个是指定单词之间的空格数,比如包含5个空格以上,对应的正则表达式是:(\w+\s){4,}\w+。


正则表达式符号说明:

  • (\w+\s) 表示任何字数后面紧跟一个空格

  • {4,} 表示重复4次以上

  • \w+表示以单词结尾


6. 查找长URL

如果要查找URL较长的页面,例如,超过100个字符数的URL,可以使用正则表达式:^[\w\W\s\S]{100,}$


7. 查找包含特殊字符的URL

查找URL包含特殊字符,正则表达式撰写:[^\/\.\-:0-9A-Za-z_]


正则表达式符号说明:

  • [^] 表示排除一系列字符

  • \/\.\-\: 表示排除URL里面非字母类的字符,例如 ://, -

  • 0-9A-Za-z_ 需要排除的字母,数字


8. 分析关键词了解用户意图

我们在做关键词分析的时候,经常会把关键词分为四大类,包括Informational,Navigational, Commercial, Transactional. 对应的正则筛选模板可参考下方:

  • Information: who|what|when|how|why

  • Navigational: .*brand.*

  • Commercial: .*(best|top|vs|review*).*


最后需要提醒大家注意的是,Google Search Console 对正则表达式的字符数长度有限制,所以建议尽可能精简表达式,例如 example.com/aa|example.com/bb 建议写成 example.com/(aa|bb),两个表达式条件一致,但是后者就精简许多。


使用正则表达式,让Google Search Console 的报告筛选变得更加强大高效,欢迎大家留言分享自己觉得很实用的正则表达式,解决什么情况的快速筛选需求。或者有想筛选/查找的情况但是不知道正则表达式怎么写的,也可以留言一起研究。




Lily  丘立妮

从事海外数字营销近十年,曾任职百度国际,负责海外hao123网站、百度浏览器搜索营销与Facebook运营;曾负责万兴科技三大品牌搜索引擎营销内容策略,有丰富的团队管理经验;服务客户:OPPO海外、唯品会、Anker、Roborock等。




内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/163541.html

(0)

相关推荐

  • 宝宝入冬流清鼻涕,立冬前后,气温骤降,洗鼻腔帮助儿童远离感冒

    近日,立冬时节,全国天气迅速转冷,济南等北方城市普降大雪。孩子们热衷于下雪和玩雪,但在这种天气下,他们也很容易感冒、咳嗽等疾病。 立冬时节,气温处于多变期,气温变化较大。连续降温几...

    生活 2021年11月11日
  • 山西为什么叫晋,山西是晋国还是赵国

    山西为什么叫晋,山西是晋国还是赵国 “人说山西好风光,地肥水美五谷香。左手一指太行山,右手一指是吕梁。站在那高处望上一望,你看那汾河的水呀,哗啦啦啦流过我的小村旁……”从上世纪60年代开始,由张棣昌谱曲、乔羽作词,郭

    攻略 2021年10月18日
  • 吸血鬼怎么无限刷经验,吸血鬼怎么刷钱

    吸血鬼幸存者1.0版正式上线,游戏中更新了大量新物品。 很多伙伴可能还不知道游戏1.0版是怎么刷金币的。 今天小编推荐吸血鬼幸存者1.0版刷金币的游戏。 快来看看吧。 : 1.0版...

    教程 2022年10月23日
  • 幼儿园标识牌设计,幼儿园班级设计标志

    幼儿园可以帮助孩子启蒙思想,适应集体学习的校园生活,是学前教育必不可少的阶段。而打造一个高端舒适的环境,标识导视的作用是不可忽视的。

    生活 2021年11月9日
  • 瀚字怎么读,翰用在男孩名意义

    瀚字怎么读,翰用在男孩名意义很多父母都会想要给孩子取一个好听的名字,但总会碰到不知如何下手的问题?为男宝宝起名要尽量参考楚辞有典故男孩名字,如果你希望为自己可爱的男宝宝起一个富有男子汉气质的响当当的大名,不妨参考一下大众

    攻略 2021年11月20日
  • 003010第七关通关策略

    《枕边故事》如何通过第七关?这是一个剧情解密游戏。很多玩家不知道怎么过第七关。接下来是柠檬朋友给大家带来的《枕边故事》第七关通关攻略。感兴趣的玩家来看看吧! 小编推荐阅读:《枕边故...

    教程 2022年7月6日