皓月与湖光一色 2022-03-05 20:05 采纳率: 33.3%
浏览 32
已结题

python3遇到 ascii' codec can't encode character网上找了半天也没法解决

UnicodeEncodeError: 'ascii' codec can't encode character '\uff1f'

初学者一个,看了几个解决办法没有弄好
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
解决不了

“python3 中的urllib.parse函数可以解析url,这里可以用来重构url,具体采用其中的 quote 函数。“
这个不知道quote怎么用

请教一下怎么解决这个问题


from bs4 import BeautifulSoup    # 网页解析,获取数据
import re       #正则表达式,进行文字匹配
import urllib.request,urllib.error  #指定URL,获取网页数据
import xlwt #进行excel操作
import sqlite3      #进行SQLite数据库操作

def main():
    baseurl='https://movie.douban.com/top250?start='
    #爬取网页
    datalist=getDta(baseurl)
    #保存数据
    savepath='.\\豆瓣电影Top250.xls'
    saveData(savepath)

    askURL('https://movie.douban.com/top250?start=0')


#逐一解析
def getDta(baseurl):
    datalist=[]

    return datalist
#得到指定的一个URL网页内容
def askURL(url):
    # 用户代理,伪装 为 浏览器 类型 的访问
    head={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.51 Safari/537.36'}
    #发送请求  封装一个request去访问
    request=urllib.request.Request(url,headers=head)
    html=""
    try:
        response=urllib.request.urlopen(request)
        html=response.read().decode()
        print(html)
    except urllib.error.URLError as e:
        if hasattr(e,'code'):
            print(e.code)
        if hasattr(e,'reason'):
            print(e.reason)

    #return html
#保存数据
def saveData(savepath):
    pass


if __name__=='__main__':
    main()
  • 写回答

2条回答 默认 最新

  • CSDN专家-showbo 2022-03-05 20:25
    关注

    改英文状态下的问号,一看就是中文的,而且逻辑

    img


    img


    有其他问题可以继续交流~

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 3月13日
  • 已采纳回答 3月5日
  • 创建了问题 3月5日

悬赏问题

  • ¥20 机器学习能否像多层线性模型一样处理嵌套数据
  • ¥20 西门子S7-Graph,S7-300,梯形图
  • ¥50 用易语言http 访问不了网页
  • ¥50 safari浏览器fetch提交数据后数据丢失问题
  • ¥15 matlab不知道怎么改,求解答!!
  • ¥15 永磁直线电机的电流环pi调不出来
  • ¥15 用stata实现聚类的代码
  • ¥15 请问paddlehub能支持移动端开发吗?在Android studio上该如何部署?
  • ¥20 docker里部署springboot项目,访问不到扬声器
  • ¥15 netty整合springboot之后自动重连失效