前段时间网站好不容易增加了文章标签功能,因为折腾不了特别深的技术原因,文章标签和网站搜索融合在一块,表面上是标签,实际上是利用搜索功能检索标签内容,不过我看过大部分的程序标签功能其实都是通过检索实现,只是url区别罢了,但是搜索功能被一些别有用心的人盯上了。

这些灰产人员使用网站站内搜索功能,搜索一些违法或者广告关键词文字,然后将搜索结果被百度收录从而达到自己的引流等非法目的,接下来几个办法可以实现:

一、robots屏蔽搜索页面

可以使用robots禁止搜索引擎抓取收录,根据自己的网站结构进行屏蔽,参考如下:

User-agent:*Disallow:/search/*Allow:/

这样处理之后,原来的功能不影响使用,还能解决违规内容被收录问题。

二、修改搜索结果页

不要将搜索的关键词文字展现到标题或者描述中,参考如下:

<title>搜索结果_云服务器排行榜</title><metaname=”keywords”content=”搜索结果”/><metaname=”description”content=”云服务器排行榜搜索”/>

这样处理之后,违规搜索内容都不会展现,对于违法利用者来说就没有意义了,但是用户体验不友好,所有的搜索页标题都一致,对网站优化还是有一些影响的。

三、屏蔽检索不到的关键词内容并返回404状态

搜索到的内容正常输出页面,搜索不到的内容直接返回404状态,本站目前就是使用的这个思路执行的,这样网站原有的功能完全不影响,对于非法搜索使用恶意关键词也会直接返回404状态,百度基本无法收录。

如果你的网站搜索功能此时被恶意利用,可以根据上述方案去尝试解决。