murphy_flush 2017-08-02 18:31 采纳率: 0%
浏览 3093
已结题

python3 ascii码无法转成unicode 整了一个晚上了!

#coding=utf-8

import urllib.request
from bs4 import BeautifulSoup

def IntoPage(p_href):
    indata = urllib.request.urlopen(p_href).read() #这里老出错,报错是'ascii' codec can't encode character u'\u2013' in position 3 2: ordinal not in range(128)
    return

data = urllib.request.urlopen(url).read()
soup = BeautifulSoup(data, "html.parser")

for sgdiv in soup.find_all('div',class_='des'):
    IntoPage(sgdiv.a.get('href'))

  • 写回答

1条回答 默认 最新

  • Marsh_Xu 2017-08-03 01:33
    关注

    可能不是代码问题,是代码编辑器的问题,代码编辑器中的编码格式没能适配。

    我用visual code编辑,在linux系统下执行你的代码,没有出现问题。

    评论

报告相同问题?