Python爬虫破解滑动验证码教程(python绕过滑动验证码)
myzbx 2025-05-03 15:41 17 浏览
破解滑动验证码通常需要结合图像识别和模拟人类操作,以下是分步骤的解决方案:
1. 分析验证码类型
- 缺口识别型:背景图带缺口,滑块图带凸块
- 轨迹验证型:除了位置还需模拟人类移动轨迹
2. 获取验证码图片
- 方法一:通过Selenium截图
python
from selenium import webdriver
driver = webdriver.Chrome()
driver.get(url)
bg_element = driver.find_element_by_id("bg_img")
slide_element = driver.find_element_by_id("slide_img")
# 截图并裁剪
bg_element.screenshot('bg.png')
slide_element.screenshot('slide.png')
- 方法二:解析网络请求获取图片URL(需抓包分析)
3. 图像处理识别缺口位置
使用OpenCV进行模板匹配
python
import cv2
import numpy as np
def find_gap(bg_path, slide_path):
# 读取图片
bg = cv2.imread(bg_path) # 背景图
slide = cv2.imread(slide_path) # 滑块图
# 灰度化处理
bg_gray = cv2.cvtColor(bg, cv2.COLOR_BGR2GRAY)
slide_gray = cv2.cvtColor(slide, cv2.COLOR_BGR2GRAY)
# 边缘检测(可选)
bg_edge = cv2.Canny(bg_gray, 100, 200)
slide_edge = cv2.Canny(slide_gray, 100, 200)
# 模板匹配
res = cv2.matchTemplate(bg_edge, slide_edge, cv2.TM_CCOEFF_NORMED)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
# 返回缺口x坐标
return max_loc[0]
4. 计算移动轨迹
- 直接跳转会触发反爬,需模拟人类加速-减速过程
python
def generate_track(distance):
track = []
current = 0
mid = distance * 0.8
t = 0.2
while current < distance:
if current < mid:
a = 2 # 加速阶段
else:
a = -3 # 减速阶段
v = v0 + a*t
move = v0*t + 0.5*a*t**2
current += move
track.append(round(move))
v0 = v
return track
5. 执行拖动操作
使用Selenium模拟
python
from selenium.webdriver import ActionChains
slider = driver.find_element_by_id("slider")
# 生成轨迹
distance = find_gap("bg.png", "slide.png")
track = generate_track(distance)
# 拖动操作
ActionChains(driver).click_and_hold(slider).perform()
for x in track:
ActionChains(driver).move_by_offset(x, 0).perform()
ActionChains(driver).release().perform()
6. 高级反爬应对策略
- 轨迹检测:添加随机Y轴偏移
python
track.append((x, np.random.randint(-2,3)))
- Canvas指纹:使用无头浏览器(Puppeteer/Playwright)
- 参数加密:逆向JS分析加密逻辑
- 深度学习:使用YOLO等模型定位缺口
注意事项
- 合法合规:仅用于授权测试
- 代理IP:防止IP被封禁
- 请求间隔:添加随机等待时间
- 验证结果:检查是否返回成功Token
完整示例代码
python
# 需安装:selenium, opencv-python, numpy
import cv2
import numpy as np
from selenium import webdriver
from selenium.webdriver import ActionChains
def crack_slide_captcha():
driver = webdriver.Chrome()
driver.get("https://example.com/login")
# 获取验证码图片
bg = driver.find_element_by_id("bg-img")
slide = driver.find_element_by_id("slide-img")
bg.screenshot("bg.png")
slide.screenshot("slide.png")
# 计算缺口位置
gap_pos = find_gap("bg.png", "slide.png")
# 模拟拖动
slider = driver.find_element_by_id("slider")
track = generate_track(gap_pos)
ActionChains(driver).click_and_hold(slider).perform()
for x in track:
ActionChains(driver).move_by_offset(x, 0).perform()
ActionChains(driver).release().perform()
return driver.get_cookies()
对抗升级方案
- 使用Pyppeteer隐藏自动化特征
- 调用第三方打码平台(人工识别)
- 部署深度学习模型(需标注数据集)
实际应用中需根据目标网站的具体实现动态调整方案。
相关推荐
- 怎么恢复7z文件 7z文件删除了怎么恢复
-
7z是一种压缩格式的文件,它运用LZMA压缩算法,该压缩算法的输出稍后被算数编码进行处理以便后续进一步压缩,压缩比十分高。我们可以将文件压缩成这种格式,便于传输,保存,占空间少。了解更多7z文件知识...
- 郎酒让消费者喝得明明白白 算术题里有答案
-
日前,『郎酒酱香产品企业内控准则』颁布,郎酒首次公开酱香产品生产全过程,公布酱香产品产能、储能及投放计划。随后,郎酒官微向消费者发出「品控算术题」有奖问答。郎酒亮出家底,消费者踊跃留言。8天后,谜底揭...
- 学龄前,比识字、算术更重要的是这三件事
-
“为了给孩子选择一家合适的幼儿园,我曾穿梭于纽约各家幼儿园的开放日,这些幼儿员既包括主流的公立幼儿园,还包括那些遥不可及的私人幼儿园。我的目的就是想了解他们的教育理念是什么,到底厉害在哪里,看看对于我...
- 参加CSP-J信奥赛需要掌握数学知识
-
在C++语法的学习中需要储备的数学知识如下①数据类型:需要知道整数、正整数、负整数、小数、判断对错②算术运算符:加法、减法、乘法、除法、取模运算③关系表达式:大于、大于等于、小于、小...
- 1g米饭能做多少深蹲?今天我们来算一算
-
减重我们都知道3分在练,7分在吃,吃这件事情上,真的是每一口都算数。今天我们来算一笔账,1粒米饭可以做多少事情?本着认真负责的态度,今天在食物秤上称了1g米饭,是16粒。根据能量换算:100g米饭是4...
- web 自动化测试,一定得掌握的 8 个核心知识点
-
使用cypress进行端对端测试,和其他的一些框架有一个显著不同的地方,它使用JavaScript作为编程语言。传统主流的selenium框架是支持多语言的,大多数QA会的pytho...
- 大话C语言:赋值运算符(c语言中赋值运算符是什么)
-
赋值运算符是最基本的运算符之一,用于将右侧的值或表达式的计算结果赋给左侧的变量。它是一个二元运算符,意味着它需要两个操作数:一个是目标变量(左侧),另一个是要赋给该变量的值或表达式(右侧)。赋值运算符...
- Vue进阶(幺幺伍):js 将字符串转换为boolean
-
Boolean();参数为0、null和无参数返回false,有参数返回true。Boolean("");//输出为:falseBoolean(null);//输出为...
- mongodb查询的语法(大于,小于,大于或等于,小于或等于等等)
-
1).大于,小于,大于或等于,小于或等于$gt:大于$lt:小于$gte:大于或等于$lte:小于或等于例子:db.collection.find({"field":{$gt:valu...
- Python学不会来打我(21)python表达式知识点汇总
-
在Python中,表达式是由变量、运算符、函数调用等组合而成的语句,用于产生值或执行特定操作。以下是对Python中常见表达式的详细讲解:1.1算术表达式涉及数学运算的表达式。例如:a=5b...
- C|数据存储地址与字节偏移、数据索引
-
话说C是面向内存的编程语言。数据要能存得进去,取得出来,且要考虑效率。不管是顺序存储还是链式存储,其寻址方式总是很重要。顺序存储是连续存储。同质结构的数组通过其索引表示位置偏移,异质结构的结构体通过其...
- 下班后累懵?4 个 JS 手写题帮你搞定前端面试高频考点
-
打工人下班后最痛苦的事,莫过于拖着疲惫的身子还要啃前端面试题吧?看着那些密密麻麻的JS代码,脑子都快转不动了!别担心,今天咱就用轻松的方式,带你吃透4道高频手写题,让你在面试时自信满满,再也不...
- 嵌入式数据库sqlite3【进阶篇】-子句和函数的使用,小白一文入门
-
sqlite在《嵌入式数据库sqlite3命令操作基础篇-增删改查,小白一文入门》一文中讲解了如何实现sqlite3的基本操作增删改查,本文介绍一些其他复杂一点的操作。比如where、orderby...
- 前缀表达式与后缀表达式(前缀表达式后缀表达式中缀表达式计算)
-
昨天晚上和儿子一起学习了前缀表达式和后缀表达式。这应该是字符串算式如何被计算机识别并计算的2种方法。本来是想先给他讲一个逆波兰式(后缀表达式),以后再讲前缀表达式。没想到他还挺聪明,很快就把2个都掌握...
- Python快速入门教程1:基本语法、数据类型、运算符、数字字符串
-
Python3的基础教程,涵盖了基本语法、数据类型、类型转换、解释器、注释、运算符、数字和字符串等内容,并附有使用实例场景。Python3的基础教程,涵盖了基本语法、数据类型、类型转换、解释器、注释、...
- 一周热门
- 最近发表
- 标签列表
-
- HTML 简介 (30)
- HTML 响应式设计 (31)
- HTML URL 编码 (32)
- HTML Web 服务器 (31)
- HTML 表单属性 (32)
- HTML 音频 (31)
- HTML5 支持 (33)
- HTML API (36)
- HTML 总结 (32)
- HTML 全局属性 (32)
- HTML 事件 (31)
- HTML 画布 (32)
- HTTP 方法 (30)
- 键盘快捷键 (30)
- CSS 语法 (35)
- CSS 选择器 (30)
- CSS 轮廓宽度 (31)
- CSS 谷歌字体 (33)
- CSS 链接 (31)
- CSS 定位 (31)
- CSS 图片库 (32)
- CSS 图像精灵 (31)
- SVG 文本 (32)
- 时钟启动 (33)
- HTML 游戏 (34)