获取到验证码图片后无法打开





#通过登录 进入到主页
#通过找登录接口  发现需要参数很多

# __VIEWSTATE：/wEPDwUKLTU5OTg0MDIwNw8WAh4TVmFsaWRhdGVSZXF1ZXN0TW9kZQIBZGQGi0FCmPHMP+KelvQVsoBoqE2Axg==
# __VIEWSTATEGENERATOR：C93BE1AE
# from：http://www.gushiwen.cn/user/collect.aspx
# email：3514247757@qq.com
# pwd：123456
# code：wszu
# denglu：登录

#__VIEWSTATE   __VIEWSTATEGENERATOR    code是一个可以变换的量

# 难点:（1）__VIEWSTATE   __VIEWSTATEGENERATOR 一般情况下看不到的数据都是在页面的源码中
#      观察到这两个数据在页面的源码中 需要获取页面源码并解析
#     （2）验证码


import  requests

#登录页面的url地址
url = 'https://www.gushiwen.cn/user/login.aspx?from=http://www.gushiwen.cn/user/collect.aspx'

headers = {
'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/139.0.0.0 Safari/537.36 Edg/139.0.0.0',
}

resp = requests.get(url=url,headers=headers)
content = resp.text


#解析页面源码  获取__VIEWSTATE   __VIEWSTATEGENERATOR
from bs4 import  BeautifulSoup
soup = BeautifulSoup(content,'lxml')

#获取__VIEWSTATE
viewstate = soup.select('#__VIEWSTATE')[0].attrs.get('value')
#获取__VIEWSTATEGENERATOR
viewstategenerator = soup.select('#__VIEWSTATEGENERATOR')[0].attrs.get('value')


#获取验证码图片
code = soup.select('#imgCode')[0].attrs.get('src')
code_url = 'https://so.gushiwen.cn' + code
#有坑
# import  urllib.request
# urllib.request.urlretrieve(url=code_url,filename='code.jpg')
#requests有一个方法 session()  通过session的返回值 就能使请求变成一个对象
session = requests.session()
#验证码url的内容
resp_code = session.get(code_url)
#注意此时要使用二进制数据 所以不能使用text
content_code = resp_code.content
#wb模式就是将二进制数据写入文件
with open('code.jpg','wb') as fp:
    fp.write(content_code)
    fp.close()

#获取验证码图片之后 下载到本地 观察验证码（或者使用图片识别）
code_name = input('请输入你的验证码:')


#登录
url_post = 'https://www.gushiwen.cn/user/login.aspx?from=http%3a%2f%2fwww.gushiwen.cn%2fuser%2fcollect.aspx'

data_post = {
    '__VIEWSTATE':viewstate,
    '__VIEWSTATEGENERATOR':viewstategenerator,
    'from':'http://www.gushiwen.cn/user/collect.aspx',
   ' email':'595165358@qq.com',
    'pwd':'action',
   ' code':code_name,
    'denglu':'登录'
}


#session保证和上面访问为同一个防止二维码改变
resp_post = session.post(url=url_post,headers=headers,data=data_post)
content_post  = resp_post.text
with open('古诗文.html','w',encoding='utf-8') as f:
    f.write(content_post)

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

6条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
紫雾凌寒新星创作者: 人工智能技术领域 2025-09-13 08:48
关注
让 “紫雾凌寒” 来帮你回答,本回答结合 DeepSeek

如果还有问题，请评论或点击头像私信，如果有帮助到您, 请关注、采纳、点赞

关键点分析：
- 目前已知通过登录进入主页，且找到登录接口但参数众多。而核心问题是获取到验证码图片后无法打开，这可能涉及到多种情况，比如图片格式错误、获取图片的方式不正确、图片链接失效、缺少相应的解析图片的库或权限等。
解决方案：
- 检查图片格式：
首先确认获取到的验证码图片的格式是否正确。常见的图片格式有JPEG、PNG等。如果格式不正确，可能无法正常打开。可以通过文件扩展名或者使用图片查看工具的文件信息查看功能来确认。
检查获取图片的代码：
如果是通过HTTP请求获取图片，检查请求是否成功。例如在Python中使用requests库：

import requests response = requests.get('验证码图片链接') if response.status_code == 200: with open('captcha.jpg', 'wb') as f: f.write(response.content) else: print('获取图片失败，状态码:', response.status_code)

- 这里要确保`验证码图片链接`是正确的，并且注意请求的权限和可能的重定向等问题。

检查图片链接：
确认验证码图片链接是否有效。有可能链接在获取后发生了变化或者本身就是错误的。可以在浏览器中直接访问该链接，看是否能正常显示图片。

检查解析图片的环境：
如果是在特定的应用环境中无法打开图片，比如在某个软件或网站中，检查该环境是否缺少必要的图片解析库或插件。例如，某些浏览器可能需要安装特定的图片查看插件才能正常显示验证码图片。
3. 多种解决方案的优缺点：

检查图片格式：
优点：简单直接，能快速定位是否是图片格式问题导致无法打开。
缺点：只能解决格式方面的问题，如果图片获取或链接等有问题，无法发现。

检查获取图片的代码：
优点：全面检查了获取图片的过程，能发现请求是否成功等问题。
缺点：需要有一定的代码编写和调试能力，对于不熟悉代码的人可能较困难。

检查图片链接：
优点：直接验证链接有效性，操作相对简单。
缺点：只能确定链接问题，不能解决其他可能导致图片无法打开的原因。

检查解析图片的环境：
优点：针对性解决特定环境下图片无法显示的问题。
缺点：需要了解该特定环境的相关知识，通用性稍差。
4. 总结：

对于获取到验证码图片后无法打开的问题，需要从多个方面进行排查。先检查图片格式，再查看获取图片的代码和链接是否正确，最后考虑解析图片的环境是否存在问题。通过逐步排查，找到导致图片无法打开的具体原因并解决。

希望以上解答对您有所帮助。如果您有任何疑问，欢迎在评论区提出。
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

易语言实现网页验证码图片获取与处理
2025-08-15 01:04

如水蜜的博客随着计算机视觉和机器学习技术的快速发展，现代OCR技术已经实现了从简单的文本识别到复杂的场景文字提取的转变。例如，在移动支付、票据自动录入、图书电子化、车牌识别等领域，OCR技术都扮演着至关重要的角色。
Qt编程实现点击图片更新验证码
2025-02-26 15:25

在野798的博客因为Qt中Qlabel是没有点击事件的,需要重写点击事件,使得即使点击Qlabel也能够刷新验证码，同时...每次打开界面都需要加载验证码,因此我们需要在构造函数中生成两个随机数。给mylabel绑定槽函数。先编写mylabel类。
易语言——取网页验证码图片模块
2021-04-14 15:30

易语言是一种专为初学者设计的编程语言，它采用了中文编程的方式，降低了编程的门槛，使得更多的人能够参与到编程活动中来。在这个“易语言——取网页验证码图片模块”中，我们主要关注的是如何通过易语言来实现从...
图片验证码小demo
2018-05-15 09:22

这通常通过编程语言提供的随机数生成函数来实现，可以指定字符集（包括字母、数字等）和长度。 2. **图像处理**：验证码的字符需要被绘制到图片上。这涉及到图像处理库的使用，如Python中的PIL（Pillow）库，它可以...
使用python+robot framework识别图片验证码
2016-06-20 17:01

此外，如果验证码是动态变化的，可能还需要考虑使用Selenium等工具模拟用户行为，实时获取验证码图片，再进行识别。总的来说，通过Python与Robot Framework的结合，我们可以实现自动化识别图片验证码，提升测试...
Python+Appium自动化测试获取短信+图片验证码
2024-10-23 22:12

自动化测试薰儿的博客本篇文章主要讲述的是如何自动获取短信验证码和如何自动获取图片验证码，并写入到对应的输入框中（以下均使用微博的找回密码作为示例）获取短信验证码的方法有三种，如下所示：在手机的通知栏中获取短信内容通过监控...
Python代码源码-实操案例-框架案例-如何获取网页中动态加载的验证码图片.zip
2024-02-22 18:50

通过Selenium，我们可以打开一个真实的浏览器实例，加载网页，等待动态内容加载完成，然后找到验证码图片元素并截取其src属性，从而获取图片URL。例如： ```python from selenium import webdriver driver = ...
python+appium自动化测试获取短信+图片验证码
2021-08-06 15:57

起码有故事的博客本篇文章主要讲述的是如何自动获取短信验证码和如何自动获取图片验证码，并写入到对应的输入框中（以下均使用微博的找回密码作为示例）获取短信验证码的方法有三种，如下所示：在手机的通知栏中获取短信内容通过...
使用 Witty 编程语言和 Python 自动化处理登录验证码
2024-11-29 18:10

ttocr.com的博客 Witty 脚本执行：Witty 自动化脚本通过调用 Python 脚本获取验证码，并将验证码输入到表单中，最后提交表单进行登录。Witty 脚本：模拟用户的登录操作，调用 Python 脚本进行验证码识别，将识别出的验证码填入登录...
python切割图片的示例
2020-12-16 19:08

在Python编程语言中，处理图像是一项常见的任务，而切割图片是图像处理的一部分。这个示例展示了如何使用Python的PIL（Pillow）库来切割图片。PIL是Python Imaging Library的派生版本，提供了丰富的图像处理功能。 ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月13日

获取到验证码图片后无法打开

6条回答 默认 最新

问题事件

6条回答默认最新