爬虫程序运行错误不知道怎么办求帮助

我想要达到的结果

能爬下来百度学术上关于我给的关键字相关的文献

问题相关代码，请勿粘贴截图

import sys
import re
import urllib.request
import xlwt
from bs4 import BeautifulSoup
#定义正则表达式筛选规则
findLink=re.compile(r'''<a href="(.*？)" data-click="{'button_tp':'title'}" target="_blank">''',re.S)#视频链接
#获取对应url网页的数据
def get_url(url):
    head = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.55 Safari/537.36 Edg/96.0.1054.34"}#模拟计算机访问网页
    request = urllib.request.Request(url,headers=head)#以headers身份访问url网页
    html=''
    try:
        reponse = urllib.request.urlopen(request)
        html = reponse.read().decode('utf-8')
    except urllib.error.URLError as e:
        if hasattr(e,'code'):
            print(e.code)
        if hasattr(e,'reason'):
            print(e.reason)
    return html
#调用get_url函数获取指定网页数据，以html形式存储
def get_data(baseurl):
    data_list=[]
    html=get_url(baseurl)#获取get_url爬到的数据
    soup=BeautifulSoup(html,'html.parser')#定义使用html解读器解读数据的变量soup
    links=soup.select('div.content .img a')
    for item in links:
        href=item.attrs['href']
        print(href)
        data_list.append(href)
    return data_list
text = input("你想要搜索什么")
url = "https://xueshu.baidu.com/s?wd="+text
get_data(url)

运行结果及报错内容

D:\python\python.exe D:/python爬虫作业/爬虫（改版）卢琮文.py
你想要搜索什么血液
Traceback (most recent call last):
  File "D:\python爬虫作业\爬虫（改版）卢琮文.py", line 36, in <module>
    get_data(url)
  File "D:\python爬虫作业\爬虫（改版）卢琮文.py", line 26, in get_data
    html=get_url(baseurl)#获取get_url爬到的数据
  File "D:\python爬虫作业\爬虫（改版）卢琮文.py", line 15, in get_url
    reponse = urllib.request.urlopen(request)
  File "D:\python\lib\urllib\request.py", line 214, in urlopen
    return opener.open(url, data, timeout)
  File "D:\python\lib\urllib\request.py", line 517, in open
    response = self._open(req, data)
  File "D:\python\lib\urllib\request.py", line 534, in _open
    result = self._call_chain(self.handle_open, protocol, protocol +
  File "D:\python\lib\urllib\request.py", line 494, in _call_chain
    result = func(*args)
  File "D:\python\lib\urllib\request.py", line 1389, in https_open
    return self.do_open(http.client.HTTPSConnection, req,
  File "D:\python\lib\urllib\request.py", line 1346, in do_open
    h.request(req.get_method(), req.selector, req.data, headers,
  File "D:\python\lib\http\client.py", line 1257, in request
    self._send_request(method, url, body, headers, encode_chunked)
  File "D:\python\lib\http\client.py", line 1268, in _send_request
    self.putrequest(method, url, **skips)
  File "D:\python\lib\http\client.py", line 1106, in putrequest
    self._output(self._encode_request(request))
  File "D:\python\lib\http\client.py", line 1186, in _encode_request
    return request.encode('ascii')
UnicodeEncodeError: 'ascii' codec can't encode characters in position 10-11: ordinal not in range(128)

进程已结束，退出代码为 1

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
技术专家团-Bamboo 2021-11-29 22:35
关注
url中的中文编码问题
改为：

url = "https://xueshu.baidu.com/s?wd=" + urllib.parse.quote(text)
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫程序出现错误如何修改 python
2022-07-22 11:10

回答 2 已采纳控制台 pip install requests
python 爬虫遇到一个不知道该怎么说的一个问题 python
2021-03-30 16:03

回答 1 已采纳 PROXY = '"'+get_ip()+'"'这样写的是错的应该写成PROXY = get_ip()，因为get_ip（）返回的已经是字符串。
用python爬虫无法导出数据 json python 爬虫
2023-03-01 20:22

回答 3 已采纳回答不易，望采纳！这一行代码报错了应该是连页面内容都没有爬下来，后边更别谈格式化处理了。检查一下你的 cookie 是不是过期了吧
php运行python爬虫_群晖系统中运行python爬虫程序
2021-02-02 21:18

weixin_39541693的博客准备入手一台NAS，事先的学习是必须的，今天在VM虚拟机中安装好NAS后，成功将python爬虫跑了起来。记录以下，以便真机使用。安装群晖过程就不说了，十分简单。群晖系统默认的python版本较低，高版本需要手动安装，...
python3爬虫百度图片，结果只能显示60张，后面都是重复 python 机器学习
2019-01-07 18:22

回答 1 已采纳 ←如果以下回答对你有帮助，请点击右边的向上箭头及采纳下答案 ``` #coding=utf-8 import re import requests from urllib import
《爬虫》代码运行没有问题，但是没有文本输出是怎么回事 python 有问必答
2022-08-26 21:16

回答 2 已采纳没有将内容写入文件啊f.write(text)
关于爬虫百度百科问题，求教各位。代码如下，运行提示错误。爬虫
2017-10-19 09:26

回答 4 已采纳你先搞个简单的试试能不能用urlopen访问百度百科，一般大的网站都做了防爬处理。
Python爬虫解析笔记.md
2023-08-27 13:24

可以通过示例代码学习编写爬虫程序的基本方法。阅读建议: 可以先了解网络爬虫的基本思想,然后重点学习示例代码,边看边在编辑器中模拟运行。最后可以尝试修改代码完成一个简单的爬虫程序。也可以关注内容中提到的...
用anaconda爬虫 python
2021-01-16 17:42

回答 1 已采纳这个是第几个输入行的意思，你每按一次空格就多加了一行
爬虫xpath应该要怎么解析一个属性为一个字典的标签 python 爬虫
2021-08-07 14:02

回答 1 已采纳这就是一个字符串吧。转义字符处理双引号或者字符串格式化输出 data_md = '{"p":"title"}' titles = li.xpath(f'.//a[@target="_blank"
爬虫报错TypeError: stat: path should be string, bytes, os.PathLike or integer, not function，如何解决？ pycharm python 有问必答爬虫
2022-01-26 20:48

回答 2 已采纳这一行写错了参数值，是False不是false,f要大写，response = requests.get(url, headers=headers, verify=False)另外函数get_ip要写
Python大作业-网络爬虫程序
2022-07-22 18:40

朽木冰天的博客本文章介绍了一个Python大作业(课程设计)-网络爬虫程序，爬取“Bangumi-我看过的动画”，文章详细展示了程序功能及程序代码。
Python爬虫详解（一看就懂）
2022-06-21 22:07

练习时长两年半的Programmer的博客爬虫简单的来说就是用程序获取网络上数据这个过程的一种名称。如果要获取网络上数据，我们要给爬虫一个网址（程序中通常叫URL），爬虫发送一个HTTP请求给目标网页的服务器，服务器返回数据给客户端（也就是我们的...
微信小程序，Python爬虫抓包采集实战，采集某成考题库小程序
2022-08-16 14:25

梦想橡皮擦的博客加密参数，此时就比较麻烦了，因为我们没有办法进行调试，如果该参数需要解析，那还面临小程序解包这一问题，不过后续的实际分析，让我松了一口气，该参数并未参加运算。找到下述路径的文件夹，然后清空该文件夹，接...
Python 爬虫运行时如何忽略错误，并继续运行
2019-07-07 16:03

ywz2008008的博客我在第一次写Python爬虫的时候，没过多久Python就会报错，然后停止采集。总是没办法从头到尾把数据采集下来。每一下次报错我都要去找原因，随着一次又一次的报错问题越来越少。比如我要采集的标签里面没有URL，URL为...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月29日

悬赏问题

¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3
¥15 牛顿斯科特系数表表示
¥15 arduino 步进电机
¥20 程序进入HardFault_Handler
¥15 关于#python#的问题：自动化测试
¥20 问题请教！vue项目关于Nginx配置nonce安全策略的问题

爬虫程序运行错误 不知道怎么办 求帮助

我想要达到的结果

问题相关代码，请勿粘贴截图

运行结果及报错内容

1条回答 默认 最新

问题事件

悬赏问题

爬虫程序运行错误不知道怎么办求帮助

1条回答默认最新