HWANGYUKAH 2020-03-22 09:20 采纳率: 0%
浏览 638

爬虫获取页面信息,放进文本,但信息不全,求助

这是参考书上的代码

import urllib.request

url='https://www.baidu.com/'

response=urllib.request.urlopen(url,timeout=3)
print('获取url信息:',response.geturl()) #返回response的url信息
print('获取返回代码:',response.getcode()) #返回response的状态代码
print('获取返回信息:',response.info()) #返回response的基本信息

result=response.read().decode('utf-8')
print(result)

with open('baidu.txt','w',encoding='utf-8') as abc:
    abc.write(result)

图片说明

文本中应该有227长,但实际文本缺少了很多东西,求解答!!谢谢

  • 写回答

1条回答 默认 最新

  • UFO_SERIESOFSOFT 2020-03-22 11:24
    关注

    建议用requests测试一下,看是不是本来数据就是那样

    评论
编辑
预览

报告相同问题?