搜索引擎如何判断素材的原创性?
1、页面的PR值:同一篇文章同时存在于两个网页中,搜索引擎一般会认为PR值高的页面是原创。
2.是否第一次被收录:如果你的文章发表后被转到了另一个网站,而搜索引擎没有先抓取你的页面,而是先抓取了那个网站的页面,那么很不幸,你很可能会被认为抄袭。
3、网站的权威性:比如一篇关于人体综合测试仪的经典技术文章,虽然你在写之前已经很努力的找了很多资料,但是如果在短时间内被某个行业网站或者产品官网引用,搜索引擎很可能会把原文出处判断为比较权威的网站,你就出局了。
4.域名注册时间和建站时间:注册时间和建站时间注明越早,被认为是原文出处的可能性越大。但是目前这些因素还不足以让搜索引擎完整正确的判定谁是原创,因为这些因素并不是搜索引擎绝对遵循的。
谷歌在这方面做得更好,因为它的参考因素复杂得多,抓取也更及时;而百度则更差,建站时间似乎是百度更看重的因素。
有时候抄袭内容页面的PR值甚至比原创内容页面的PR值还要高,解释起来比较复杂。