看alexa排名,无意中发现一个有趣的防止内容被copy的方法:

http://www.alexa.com/data/details/traffic_details?url=sports.cn 底下的频道排行位置copy出来的内容如下:

lo2ttery24.sports.cn - 29838556% 
bbs.spo26rts.8985cn - 26% 
lot57terychart.sp91ort68s.2696cn - 13% 
19news.47s58por0ts.cn - 12% 
tren54d.sports.cn - 11% 
67star.5526sports.cn - 733% 
10sp87or21ts.cn - 2313% 
li34ux15ia82n74g.sport75s.cn - 2% 
345v.spo81rt62s.cn - 1% 
96672e16sport.40sp32orts.20cn - 1%

数据完全没法用:发现alexa在代码中做了手脚,用<span>将需要加密的内容拆分定义,class随机分配,真内容跟伪信息都用<span>定义样式,完全无规律可言。

这样一来,无论是从页面copy,还是源代码copy,甚至spider抓取分析,都没有太好的办法分离出原始内容。

想copy原始内容,只有将css样式表也copy过来,那就不是编辑行为了,会上升到工程师行为,实施难度就可想而知。

这应该是个防止网站间原创内容被窃取的一个办法。

html/防止原创内容被copy.txt · 最后更改: 2007/05/13 20:36 由 kingkong
到顶部
chimeric.de = chi`s home Creative Commons License Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0 红麦软件 红麦软件