网站被采集的几个处理方法_非技术

只要是能让浏览器访问的,就没有不能采集的 。但是可以通过一定的手段让采集变得非常麻烦,进而在大量数据的情况下延迟采集完成时间,加大采集难度 。

1、网站内容采用多套模板,随机模板,给采集程序设置过高的门槛;但这招对整站采集器不起作用 。

【网站被采集的几个处理方法_非技术】2、网站内容里随机插入本网站的版权,如域名,网站名称,网站主人,而这些标识可以分开来写,或中间加短横-,或换成全角字符,防止被自动过滤 。

3、给我们网站里的图片打上自己的logo标识,比如在图片的右下角打上网站的名称 域名;采集者把我们的网站的图片采集过去,不可能一张一张图片都ps;所以,他们采集我们的网站内容,等于变相地帮助我们宣传网站 。


网站被采集的几个处理方法_非技术
文章插图
文章插图

4、这招比较损 。如果对方采集的程序几乎和你的网站同步,那么你可以采用这招了 。先在我们的网站里添加几篇标题以及文章开头结尾都很正规的内容,而在文章内容中间偷偷插入非法关键字,有多非法就要多非法,多插入几个,隐蔽工作做的也要到位,然后在我们的网站robots.txt文件里禁止搜索引擎抓取这几篇文章 。等对方采集了这几篇文章后,我们立即删除自己网站上的这些文章,然后向采集者服务器当地网警举报 。

    推荐阅读