文本混淆反爬虫-图片伪装

目标网址:http://www.porters.vip/confusion/recruit.html

爬取企业名称和联系电话:

但是这次不同的是,电话是一个图片,我们需要抓取图片,再用文字识别。

图片文字识别用的是百度的通用OCR:模板传送

抓取结果展示:

示例对应的网站:广西人才网

抓取代码:

程序员未雨

Do one thing at a time, and do well.

暂无评论

发表评论

您的电子邮件地址不会被公开,必填项已用*标注。

相关推荐

微信扫一扫

微信扫一扫

微信扫一扫,分享到朋友圈

文本混淆反爬虫-图片伪装