灰色词菠菜SEO快照劫持与推广揭密

都是腾讯的条码页,关上看一看:

404来的,看见沃尔辛的位数。老郁闷的,秉持自学的目地,竭尽全力思量呵呵看一看能无法找寻点啥小东西出。先去瞅瞅恒定的tag网页是啥样的,就行了找个头版块的条目页看一看:

那些是关键字,滑鼠移上去就会在右上角看见她们的镜像。这儿重新整理诸杨给我们看一看:

# 胡亚捷  http://ent.163.com/keywords/5/1/52186d9b/1.html

# 带子并非桂花红   http://ent.163.com/keywords/9/1/9b138fb94e0d662f6d7768e07ea2/1.html

# 满江红  https://ent.163.com/keywords/6/0/6e055e734e50/1.html

# 白水无间道记  https://ent.163.com/keywords/5/5/585e4e0a98ce4e918bb0/1.html

能看见,镜像的pattern是这种的:

https://ent.163.com/keywords/{身份验证ID[1]}/{身份验证ID[3]}/{身份验证ID}/1.html

能总结出腾讯的tag镜像组成特征:

1. keywords后面跟着的两个位数目录是关键字身份验证后的,第一和第三个字符2. 关键字身份验证后的长度跟关键字的字数成正比

接下来是要研究它的身份验证算法了,一般的,看身份验证算法先了解字符串的长度和特征,这儿就不说了。看见身份验证后的都是小写的位数加字母,而且字母只出现了a/b/c/d/e/f这几个,再结合身份验证后的长度验证,得出这个是一个简单的16进制身份验证:

能看见,这个一个汉字对应得出4个位数的身份验证,那这个是16进制的身份验证了,16进制是占用4个字节的,所以刚刚好。但是那些汉字是如何转换成位数的呢?如果对编码熟悉的童鞋就会知道,一个汉字得到4个位数,不是unicode编码的16进制表达么。只要轻松转换呵呵就好了。这儿补充呵呵,由于字母转换成unicode编码的16进制之后,得到的是两位数,因此需要对它进行等宽对齐到4位。

有了想法,那么是校验的过程了,代码搞起来:

校验成功之后是封装成函数了,好方便调用:

是这么简单,然后是批量生成关键字的镜像,拿去发外链就好了:

特么牛掰,不得不说,做黑帽的技术是牛,不佩服不行。

今天的分享就到这儿,如果你能看懂相信一定是懂程序开发的大神级人物了,如果看不懂也不需要深入研究,了解下黑帽SEO的玩法原理也无妨。

友情提示:为了你的生命安全,提倡白帽SEO,远离灰产黑帽SEO。

那么问题来了,为啥那些构造出的404网页也能够被收录呢?欢迎我们留言探讨。

防走丢!请关注公众号:万项汇

版权声明:
作者:wxfb
链接:https://www.28php.com/6542.html
文章版权归作者所有,未经允许请勿转载。
THE END
分享
二维码
< <上一篇
下一篇>>