这(zhè)是简(jiǎn)单验证码识别((CSDN资源上传验证码(mǎ)识别率100%,久游网登陆90%))下载(zǎi),工作需要接触python ,说实话,三年多的JAVA,一直在(zài)业务线上工作(zuò),这个python是什么玩意,一点概(gài)念没有,平常(cháng)很难(nán)接触到,利用周末两天时间,抓紧突击了(le)一(yī)下,感觉还(hái)不(bú)错,挺容易(yì)上手的,就是(shì)写法上,让(ràng)人有点适应不了,不过,还(hái)好,上(shàng)一个最简单的例子,为了突显(xiǎn)真实(shí)性,我(wǒ)是直接获取的CSDN官网的验(yàn)证码做的测试用例。
简单验(yàn)证码识别((CSDN资(zī)源(yuán)上传验证码识别率100%,久游网登陆90%))是对CSDN资源上(shàng)传(chuán)验证码(mǎ)识别率100%,对久游(yóu)网登陆(lù)90%。
1.图片大小固定,默认(rèn)80*20。数(shù)字个数(shù)固定,默认(rèn)4,每个数字大小固定,默认20*20。
2.矢量随(suí)机角度值(默认随(suí)机量10°)和随机长度值(默认随机量(liàng)10%比率(lǜ))。最(zuì)终图(tú)片根据随机后的点阵自动缩放大小调整。
3.有随机噪(zào)点。默认噪点比率:背景20%,数字10%。
4.噪(zào)点特征:Brightness > 50
5.数字可随机颜色。数字的Brightness均为50
1. 安装(zhuāng)Python,选(xuǎn)择3.X就可(kě)以(安装过程中别忘(wàng)了选择(zé)PIP),选择32位的。
2. PIP方式安装Pillow(PIL没有支持Python3),网上(shàng)一大堆都(dōu)是安装PIL,太过时(shí)了
3. 安装pytesser,csdn上自己下载,反正好像就一个版本pytesser_v0.0.1,在python/lib/site-packages新建pytesser文件夹,并新建一个pytheeer.pth,内容就写(xiě)pytesser,要不然(rán)找不到(dào)这(zhè)个类库,然后解压下载的所有文(wén)件放进去,这里有(yǒu)一些(xiē)注意的地方,在引(yǐn)入pytesser中的模块之(zhī)后,项目中会出现Python语法不通过(guò),不过没关系,Pytesser里面(miàn)是Python2.X写法(fǎ),只需(xū)要改成3.X写(xiě)法就OK,如print(text);
注意(yì):更改pytesser下的pytesser.py文件(jiàn)名为_init_.py,里面的tesseract_exe_name= 'C:\\Python35-32\\Lib\\site-packages\\pytesser\\tesseract’
4. PIP方式安装requests库
5. 安装(zhuāng)Pymysql用于存储读取的验证码
6. 最后我用(yòng)的(de)开发环境是(shì)Pycharm
OK了,然后直(zhí)接上测试(shì)结果,代码中(zhōng)有不(bú)规(guī)范的地方,误喷。
