看alexa排名,无意中发现一个有趣的防止内容被copy的方法:
http://www.alexa.com/data/details/traffic_details?url=sports.cn 底下的频道排行位置copy出来的内容如下:
lo2ttery24.sports.cn - 29838556% bbs.spo26rts.8985cn - 26% lot57terychart.sp91ort68s.2696cn - 13% 19news.47s58por0ts.cn - 12% tren54d.sports.cn - 11% 67star.5526sports.cn - 733% 10sp87or21ts.cn - 2313% li34ux15ia82n74g.sport75s.cn - 2% 345v.spo81rt62s.cn - 1% 96672e16sport.40sp32orts.20cn - 1%
数据完全没法用:发现alexa在代码中做了手脚,用<span>将需要加密的内容拆分定义,class随机分配,真内容跟伪信息都用<span>定义样式,完全无规律可言。
这样一来,无论是从页面copy,还是源代码copy,甚至spider抓取分析,都没有太好的办法分离出原始内容。
想copy原始内容,只有将css样式表也copy过来,那就不是编辑行为了,会上升到工程师行为,实施难度就可想而知。
这应该是个防止网站间原创内容被窃取的一个办法。
到顶部