weixin_43884285 2019-01-03 18:08 采纳率: 50%
浏览 3931

用python3爬链家的网页,遇到了AttributeError: 'str' object has no attribute 'select'的报错?

源码:

# -*- coding:utf-8 -*-
from urllib import request

from bs4 import BeautifulSoup

import bs4

def get_data():
    url = 'https://nj.lianjia.com/ershoufang/gulou/'
    headers = {
        'User_agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36'
    }
    req = request.Request(url, headers=headers)
    response = request.urlopen(req)
    if response.getcode() == 200:
        data = response.read()
        data = str(data, encoding='utf-8')
        print(data)
        with open('index.html', mode='w', encoding='utf-8') as f:
            f.write(data)


def parse_data():
    with open('index.html', mode='r', encoding='utf-8') as f:
        html = f.read()

    bs = BeautifulSoup(html, 'html.parser')  # 析HTML文件的时候就是用parser的
    divs = bs.find_all(class_='clear LOGCLICKDATA')[0].get_text()
    for div in divs[0:]:
        div1 = div.select('.address')[0]
        print(div1)


if __name__ == '__main__':
    # get_data()
    parse_data()

报错显示是
div1 = div.select('.address')[0]
这一行出了问题
还请各位帮忙看看是怎么了

  • 写回答

3条回答 默认 最新

  • qq_24499417 2019-01-03 21:38
    关注
    def parse_data():
        with open('index.html', mode='r', encoding='utf-8') as f:
            html = f.read()
    
        bs = BeautifulSoup(html, 'html.parser')  # 析HTML文件的时候就是用parser的
        divs = bs.find_all(class_='clear LOGCLICKDATA')[0]
        div=divs.select('.address')[0].text
        print(div)
    
    评论

报告相同问题?

悬赏问题

  • ¥15 树莓派与pix飞控通信
  • ¥15 自动转发微信群信息到另外一个微信群
  • ¥15 outlook无法配置成功
  • ¥30 这是哪个作者做的宝宝起名网站
  • ¥60 版本过低apk如何修改可以兼容新的安卓系统
  • ¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
  • ¥50 有数据,怎么建立模型求影响全要素生产率的因素
  • ¥50 有数据,怎么用matlab求全要素生产率
  • ¥15 TI的insta-spin例程
  • ¥15 完成下列问题完成下列问题