44840862 2019-05-18 17:47 采纳率: 0%
浏览 462

python使用yield进行strip()去除空格后列表顺序发生变化,请问大神们是什么原因啊?初学者

新手刚接触Python爬虫,本来是为了拿段html代码练习正则表达式,结果输出结果后有空格,想用yield和strip进行去除空格后整理并输出成excel,但是只要一去除空格,顺序就发生变化了,麻烦大神看看是怎么回事吧,感谢!!!
图片说明

图片说明

练习用的代码:

import requests,re             #获取url
def get_page(url):
    headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'}
    response=requests.get(url,headers=headers)
    if response.status_code==200:
        return response.text
    else:
        return none
`
import requests
import re
import xlwt
url='https://movie.douban.com/review/best/?start=0'
html=re.sub(" ","",get_page(url))  
pattern=re.compile('main-hd.*?name">(.*?)</a>.*?main-meta">(.*?)</span>.*?main-bd">.*?href.*?>(.*?)</a></h2>.*?r-useful_count.*?>(.*?)</span>.*?r-useless_count.*?>(.*?)</span>',re.S)
items=re.findall(pattern,html1)
workbook=xlwt.Workbook(encoding='utf-8')
worksheet=workbook.add_sheet('my worksheet')
for a in items:
    for b in a:
        print(b)                 #结果一:正确顺序

def zhengliA(items):   #多余空格去掉
    for item in items:
        yield{
            item[0],
            item[1],
            item[2],
            item[3].strip(),              #strip去除前后空格回车
            item[4].strip()
        }
for i in zhengliA(items):
    for j in i:
        print(j)         #结果二:顺序不对
  • 写回答

3条回答 默认 最新

  • weixin_44104054 2019-05-18 18:07
    关注

    用另一个去空格的函数试试

    评论

报告相同问题?

悬赏问题

  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料