网站被采集的几个处理方法_非技术 _采集

只要是能让浏览器访问的，就没有不能采集的。但是可以通过一定的手段让采集变得非常麻烦，进而在大量数据的情况下延迟采集完成时间，加大采集难度。

1、网站内容采用多套模板，随机模板，给采集程序设置过高的门槛;但这招对整站采集器不起作用。

【网站被采集的几个处理方法_非技术】2、网站内容里随机插入本网站的版权，如域名，网站名称，网站主人，而这些标识可以分开来写，或中间加短横-，或换成全角字符，防止被自动过滤。

3、给我们网站里的图片打上自己的logo标识，比如在图片的右下角打上网站的名称域名;采集者把我们的网站的图片采集过去，不可能一张一张图片都ps;所以，他们采集我们的网站内容，等于变相地帮助我们宣传网站。

文章插图
文章插图

4、这招比较损。如果对方采集的程序几乎和你的网站同步，那么你可以采用这招了。先在我们的网站里添加几篇标题以及文章开头结尾都很正规的内容，而在文章内容中间偷偷插入非法关键字，有多非法就要多非法，多插入几个，隐蔽工作做的也要到位，然后在我们的网站robots.txt文件里禁止搜索引擎抓取这几篇文章。等对方采集了这几篇文章后，我们立即删除自己网站上的这些文章，然后向采集者服务器当地网警举报。