如何使用python爬取canvas中的内容呢？

我想要爬取一个pdf（canvas）格式的文件。

这个文件里的文字部分我都能通过数据包获取，但是图片类的就不行了。虽然我能在网页代码里找到图片链接，但是无法做到将图片取出来，并放在合适的位置。

如果我想将这个文件完整的爬取下来的话该怎么做呢？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
吕布辕门新星创作者: 后端开发技术领域 2022-04-29 10:44
关注
需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。

后端python处理：

import cv2 as cv
from encodings import base64_codec

def img2dataURL(img):
ret, jpg_data = cv.imencode('.jpg', img)
data, data_size = base64_codec.base64_encode(jpg_data)
return 'data:image/png;base64,'+data
前端js绘图：

var image = new Image();
image.onload = function(){
var canvans = document.getElementById("canvas");
var ctx = canvans.getContext("2d");
ctx.drawImage(image, 0, 0, 320, 240);
}
image.src = data.data;

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python获取网页canvas图片并添加至excel中
2022-02-28 13:57

南晟的博客 canvas是目前主要流行的网页图片制作元素，以下图为例，图片元素中仅包含canvas的画布信息，无法得到其中具体的数据。此处介绍如何保存图片，想得到具体数据可查看主页另一篇文章。可以先将图片信息保存为base64...
Python读取本地HTML中的canvas以图片形式存入Word文档
2022-08-15 08:59

小小明-代码实体的博客 Python读取本地HTML中的canvas以图片形式存入Word文档
爬虫遇到canvas生成的图片如何采集
2022-07-21 13:37

qq_40157234的博客爬虫如何获取canvas图片
python爬取全国各地天气带图形界面
2021-02-05 11:43

前端技术的博客 python爬取全国各地天气带图形界面话不多说，直接上代码： import requests from lxml import etree import re import tkinter as tk from PIL import Image, ImageTk from xpinyin import Pinyin def get_image...
Python 爬虫进阶：爬取需要滑块验证的网站（破解实战）
2025-11-11 23:52

python 爬虫工程师的博客文章提供完整的Python实现代码，涵盖图像处理、轨迹生成、模拟滑动等关键环节，并讨论进阶优化策略。强调必须在法律允许范围内应用该技术，遵循网络安全规范。通过本案例可深入理解反爬机制与破解技术的对抗逻辑。
selenium利用js从canvas中获取内容图片的方法
2021-03-09 17:26

lizz2276的博客 Selenium支持各种语言的binding，方便起见，下面的测试脚本都用Python来写。自动化功能测试用例流程基本上是这样的：启动浏览器 -> 打开游戏(网页)-> 对游戏图像进行模板匹配，确保UI元素显示正确 -> ...
【Python】读取canvas
2025-07-01 19:37

宅男很神经的博客要让Python“看到”并捕获canvas的渲染结果，最直接且有效的方法是利用无头浏览器 (Headless Browser)。1.3.1 什么是无头浏览器？无头浏览器是一个没有图形用户界面（GUI）的Web浏览器。它拥有与普通浏览器（如...
python实现天气数据爬取实现数据可视化和天气查询gui界面设计
2021-09-08 08:31

lei吼吼的博客在学校大一实训中，我的实训项目就是使用python爬取天气数据并且实现gui图形界面的设计。实训结束了，希望自己的代码可以帮助大家的学习。第一个部分是getdata的部分，就是爬取数据，并将数据存放在csv文件中 ...
对疫情数据进行爬取、分析、可视化，使用d3可视化.zip
2021-12-14 15:44

在这个项目中，开发者使用Python进行网络数据爬取，可能是利用Python的requests库来发送HTTP请求获取网页内容，再通过BeautifulSoup或Scrapy等库解析HTML或JSON等格式的数据。爬取疫情数据可能涉及到处理JavaScript...
Python爬虫怎样绕过验证码？
2020-04-27 21:57

学术严谨的博客 cookie一般由前端开发用js生成，可以利用抓包尝试下破解，不过这个难度有点高，不过破解js本就是爬虫必须直面面对的 2OCR库里的tesseract（光学文字识别）可以解决大多数的传统验证码软件tesserract-ocr先安装...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 5月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 4月29日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 4月29日

如何使用python爬取canvas中的内容呢？

1条回答 默认 最新

问题事件

1条回答默认最新