醉卧不知天在水 2021-07-25 10:44 采纳率: 0%
浏览 37

对了好几遍还是找不到哪里出了问题


import requests
import re

domain='https://www.dytt89.com/'
resp=requests.get(domain)
resp.encoding='gb2312'

obj1=re.compile(r"2021必看热片.*?<ul>(?P<ul>.*?)</ul>",re.S)
obj2=re.compile(r"<a href='(?P<href>.*?)'",re.S)
obj3=re.compile(r'◎片  名(?P<movie>.*?)<br />.*?'
                r'<td style="WORD-WRAP: break-word" bgcolor="#fdfddf"><a href="(?P<address>.*?)”>',re.S)
result1=obj1.finditer(resp.text)
child_href_list=[]
for it in result1:
    ul=it.group('ul')
    #print(ul)
    result2 = obj2.finditer(ul)
    for it2 in result2:
        child_href = domain + it2.group('href').strip('/')
        child_href_list.append(child_href)
for href in child_href_list:
    resp2 = requests.get(href)
    resp2.encoding = 'gb2312'
    r3 = obj3.search(resp2.text)
    print(r3.group('movie'))
    print(r3.group('address'))

结果一直是
Traceback (most recent call last):
File "D:/pachong/第二章/04.py", line 27, in
print(r3.group('movie'))
AttributeError: 'NoneType' object has no attribute 'group'
'''

  • 写回答

2条回答 默认 最新

  • 鸡蛋酱$ 2021-07-25 12:52
    关注

    额,要re的compile的东西遍历后才有group,其他的都没有,你的这里只有result1遍历后的it才有group,你的child_href_list是列表,没有group的哦
    有用的话点一下采纳

    评论

报告相同问题?

问题事件

  • 修改了问题 7月25日
  • 创建了问题 7月25日

悬赏问题

  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站
  • ¥50 成都蓉城足球俱乐部小程序抢票
  • ¥15 yolov7训练自己的数据集
  • ¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)(相关搜索:51单片机|单片机|测试代码)
  • ¥15 电力市场出清matlab yalmip kkt 双层优化问题
  • ¥30 ros小车路径规划实现不了,如何解决?(操作系统-ubuntu)