文本混淆反爬虫-SVG映射反爬虫

SVG映射反爬虫,是将关键的数字用 <d></d> 去替换了。只要找到映射关系就好了。

目标网址:http://www.porters.vip/confusion/food.html

第一版

结果展示:

代码如下:

第二版

内容是一样的,但是第二版是实际业务中的步骤

讲一下具体思路:

  1. 首先抓取css文件,匹配里面的特殊字符串、横纵坐标,放到列表待用。
  2. 抓取svg文件,获取 text 的所有行数据(包含横纵坐标)
  3. 遍历css的列表,根据y值,去匹配svg-text文件的具体行数,并将结果行返回
  4. 根据x的坐标,除以字体大小,就等于当前的字符串映射位于本行的位置
  5. 将 字符串、结果放入一个字典
  6. 爬取目标页面,获取里面的特殊字符串,返回列表,遍历列表,根据字典get方法取值、建立映射关系。

程序员未雨

Do one thing at a time, and do well.

暂无评论

发表评论

您的电子邮件地址不会被公开,必填项已用*标注。

相关推荐

微信扫一扫

微信扫一扫

微信扫一扫,分享到朋友圈

文本混淆反爬虫-SVG映射反爬虫