首页
技术小册
AIGC
面试刷题
技术文章
MAGENTO
云计算
视频课程
源码下载
PDF书籍
「涨薪秘籍」
登录
注册
聊聊Web自动化测试:黑盒、白盒、α测试、β测试、冒烟测试、回归测试
Selenium三剑客:WebDriver、IDE、Grid一网打尽
Selenium开发环境搭建
下载安装浏览器驱动:教你解决最麻烦的版本匹配问题
第一个Selenium测试:Selenium测试流程、源码分析
实现元素定位:掌握Selenium八大定位方法
通过打车生活案例,深入剖析WebDriver运行原理
掌握WebDriver核心方法和属性的使用
掌握WebElement核心方法和属性的使用
form表单:熟练掌握form表单操作步骤
掌握checkbox和radiobutton的定位技巧
下拉列表:熟练使用Select类,来实现下拉列表定位
弹框处理:掌握alert、confirm、prompt三种弹出的用法
Selenium三种等待方式:剖析原理、用法和应用场景
Selenium等待条件:掌握17种元素等待条件
掌握鼠标单击、双击、右击,键盘输入、键盘组合键的应用
熟练执行JavaScript的方法和技巧,掌握JavaScript操作滚动条
Selenium屏幕截图:实现屏幕截屏、按照日期时间格式保存图片
掌握frame、iframe定位,熟练frame的切入和切出
下载安装Selenium IDE:下载安装Chrome、Firefox插件IDE
熟练Selenium IDE菜单栏、工具类、命令窗口的使用
Selenium IDE实现录制和回放及脚本导出
项目环境搭建:安装JDK、MySQL、Tomcat和测试系统
需求分析和用例设计:深度挖掘需求,掌握测试用例设计范式
项目架构设计:掌握分层设计思想,合理设计目录和包结构
解决验证码问题-方案一:使用pytesseract和Pillow实现验证码识别
解决验证码问题-方案二:通过第三方AI库识别验证码
实现工具类:设计获得验证码、随机字符串生成、cookie操作工具类
完成用户注册测试用例:解决验证码、等待弹框等复杂内容
完成用户登录测试用例:实现登录成功和失败测试
完成管理员登录测试用例:完成验证码正确和错误测试用例
完成文章分类测试用例:解决测试用例依赖问题
完成添加、删除文章测试用例
unittest简介:测试用例、测试套件、测试运行器、测试加载器
unittest中的方法:掌握各种setup、teardown和断言方法
测试用例、测试套件和测试加载器:掌握加载测试用例的四种方法
使用unittest重构测试用例:掌握使用unittest模块的方法和技巧
为项目添加测试报告:使用第三方模块实现测试报告
pytest框架简介:pytest安装、用例编写规则、执行用例
pytest标记:查找测试策略、标记测试函数
pytest参数化处理:使用参数化装饰器、解析列表、元组、字典等数据
pytest Fixture:使用fixture实现用例之间的调用
pytest setup 和 teardown
pytest allure生成测试报告
使用pytest重构项目:实现用例依赖、测试报告、数据参数化
logging模块简介:日志的作用、等级和常用函数
logging日志格式输出:日志发生的时间、文件、模块、行号等信息格式输出
logging模块四大组件:Logger、Handler、Formatter、Filter的用法
为项目添加日志:将日志应用到项目
使用csv模块读取CSV文件,使用pytest参数化实现DDT
使用json模块读取json文件,使用pytest参数化实现DDT
使用xlrd模块读取excel文件,使用pytest参数化实现DDT
Selenium读取数据库数据:将数据保存到数据库,实现数据驱动的测试
Selenium DDT:使用DDT模块实现数据驱动的测试
使用DDT思想重构项目:使用数据库保存数据,将数据驱动思想应用到项目
POM设计模式简介:理解页面-对象-模型设计模式,实现代码的松耦合
设计BasePage类:设计基类,提高项目的代码重用性
设计项目页面对应的PO类:使用POM设计模式设计PO类
设计项目测试用例:将POM设计模式应用到项目
Selenium Grid下载安装:配置Java运行环境,下载安装Selenium Grid
Selenium注册node节点
使用Selenium执行远程测试
Jenkins环境搭建:下载安装Jenkins
在Jenkins中运行项目
邮件通知:实现邮件通知功能
定时运行项目,实现真正的自动化测试
当前位置:
首页>>
技术小册>>
Selenium自动化测试实战
小册名称:Selenium自动化测试实战
### 章节标题:解决验证码问题-方案一:使用pytesseract与Pillow实现验证码识别 在自动化测试领域,验证码(CAPTCHA,Completely Automated Public Turing test to tell Computers and Humans Apart)的存在一直是自动化脚本难以逾越的障碍之一。验证码设计的初衷是为了区分人类用户与自动化程序,防止自动化脚本滥用系统资源或进行恶意操作。然而,在测试环境中,自动化处理验证码往往成为提升测试效率、实现全面自动化测试的关键一环。本章将详细介绍如何使用`pytesseract`(一个Python库,用于执行OCR——光学字符识别)结合`Pillow`(Python Imaging Library的一个分支,用于图像处理)来实现验证码的自动识别。 #### 一、引言 随着Web应用安全性的不断提升,验证码的形式也日益多样化,从简单的数字、字母组合,到复杂的图形验证码、滑动验证码、点击验证码等。尽管高级的验证码类型需要更复杂的解决方案,但针对基本的图像验证码(如数字、字母混合的验证码),使用OCR技术结合图像处理是一个有效的解决方案。 #### 二、准备工作 ##### 2.1 安装必要的库 首先,确保你的Python环境中已安装了`Pillow`和`pytesseract`。如果未安装,可以通过pip进行安装: ```bash pip install Pillow pytesseract ``` 注意:`pytesseract`是Tesseract-OCR引擎的Python封装,因此你还需要安装Tesseract-OCR本身。可以从[Tesseract的GitHub页面](https://github.com/tesseract-ocr/tesseract)或你的操作系统的包管理器中获取安装指导。 ##### 2.2 配置Tesseract 安装完Tesseract后,需要确保Python能够找到它的执行路径。这通常通过设置环境变量`TESSDATA_PREFIX`(指向包含`tessdata`目录的路径)和`PATH`(包含Tesseract可执行文件的路径)来实现。在Windows上,你可以通过系统的环境变量设置来完成;在Linux或macOS上,则可以通过修改`.bashrc`、`.bash_profile`或`.zshrc`等文件来设置。 #### 三、使用Pillow处理验证码图像 在识别验证码之前,往往需要对验证码图像进行预处理,以提高OCR识别的准确率。`Pillow`提供了丰富的图像处理功能,如调整大小、裁剪、灰度化、二值化等。 ##### 3.1 加载图像 ```python from PIL import Image # 加载验证码图像 captcha_image = Image.open('path_to_captcha_image.jpg') ``` ##### 3.2 图像预处理 图像预处理的具体步骤取决于验证码图像的复杂度和OCR引擎的识别能力。以下是一些常见的预处理步骤: - **灰度化**:将彩色图像转换为灰度图像,减少处理的数据量。 ```python captcha_image = captcha_image.convert('L') # 转换为灰度图像 ``` - **二值化**:将灰度图像转换为黑白图像,进一步简化图像信息。 ```python # 假设使用固定阈值进行二值化 threshold = 127 captcha_image = captcha_image.point(lambda p: p > threshold and 255) ``` - **去噪**:通过滤波器去除图像中的噪点,提高识别精度。 ```python from PIL import ImageFilter # 应用中值滤波器去噪 captcha_image = captcha_image.filter(ImageFilter.MedianFilter()) ``` - **裁剪**:如果验证码图像中包含不需要的背景信息,可以通过裁剪去除。 ```python # 假设验证码位于图像的某个特定区域 left, top, right, bottom = 10, 10, 100, 50 # 根据实际情况调整 captcha_image = captcha_image.crop((left, top, right, bottom)) ``` #### 四、使用pytesseract进行OCR识别 在图像预处理完成后,就可以使用`pytesseract`对验证码图像进行OCR识别了。 ##### 4.1 识别验证码 ```python import pytesseract # 配置pytesseract的路径(如果需要) # pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>' # 识别图像中的文字 captcha_text = pytesseract.image_to_string(captcha_image, lang='eng') # 假设验证码是英文 print(captcha_text) ``` 注意:`lang='eng'`参数指定了使用的语言包,对于不同的验证码内容(如中文、日文等),需要下载并指定相应的语言包。 ##### 4.2 识别结果处理 OCR识别的结果可能包含多余的空格、换行符或错误的字符,因此需要对识别结果进行进一步的处理。 ```python # 去除多余的空格和换行符 captcha_text = captcha_text.replace(' ', '').replace('\n', '') # 根据需要,可能还需要进行其他处理,如过滤非字母数字字符等 import re captcha_text = re.sub(r'[^a-zA-Z0-9]', '', captcha_text) print(captcha_text) ``` #### 五、实战案例分析 为了更好地理解上述过程,我们通过一个实战案例来分析。假设你正在测试一个登录功能,该登录页面包含一个由数字和字母组成的简单验证码。你可以按照以下步骤进行操作: 1. **捕获验证码图像**:使用Selenium捕获验证码图像。 2. **保存并预处理图像**:将图像保存到本地,并使用Pillow进行预处理。 3. **使用pytesseract进行OCR识别**:调用pytesseract库识别预处理后的图像。 4. **处理识别结果**:清理识别结果,并将其作为输入填入登录表单。 5. **提交表单并验证**:提交登录表单,并验证是否成功登录。 #### 六、总结与展望 使用`pytesseract`和`Pillow`实现验证码的自动识别,为自动化测试提供了一种有效的解决方案。然而,需要注意的是,随着验证码技术的不断发展,简单的OCR识别方法可能无法应对所有类型的验证码。因此,对于更复杂的验证码,可能需要采用更高级的解决方案,如机器学习、深度学习等。 此外,OCR识别的准确率受多种因素影响,包括验证码图像的清晰度、字体、布局等。在实际应用中,可能需要根据具体情况调整图像预处理的步骤和参数,以提高识别准确率。 未来,随着技术的不断进步,我们可以期待更加智能、高效的验证码识别解决方案的出现,为自动化测试带来更多的便利和可能性。
上一篇:
项目架构设计:掌握分层设计思想,合理设计目录和包结构
下一篇:
解决验证码问题-方案二:通过第三方AI库识别验证码
该分类下的相关小册推荐:
Python编程轻松进阶(三)
Python合辑9-判断和循环
Python爬虫入门与实战开发(上)
Python合辑5-格式化字符串
剑指Python(磨刀不误砍柴工)
Python合辑8-变量和运算符
Python高性能编程与实战
Python合辑7-集合、列表与元组
Python合辑13-面向对象编程案例(上)
Python编程轻松进阶(一)
Python机器学习实战
Python高并发编程与实战