小Hello姐姐 2024-07-25 11:07 采纳率: 87.5%
浏览 1
已结题

python爬虫运行豆瓣网页,bs4有错误,如何解决?

python爬虫运行豆瓣网页,bs4有错误?
代码:

img


运行截图:

img

  • 写回答

3条回答 默认 最新

  • 专家-赤兔[在线] 全栈领域优质创作者 2024-07-25 11:07
    关注

    引自免费微信小程序:皆我百晓生

    首先,对于你在使用BeautifulSoup解析豆瓣网页时遇到的问题,我会尝试帮助你解决。但是,我需要你提供更多的信息,比如具体的错误信息和代码片段,以便我能更准确地定位问题。关于你提供的图3和图4,看起来像是与LXML解析器有关的问题。

    对于你遇到的错误“AttributeError: 'function' object has no attribute 'XMLParser'”,这个错误可能是因为你的环境中的LXML库有问题或者版本不兼容。以下是一些可能的解决方案:

    1. 检查你的LXML库是否已经正确安装并可以使用。你可以尝试卸载然后重新安装LXML库。在命令行中运行以下命令:
    pip uninstall lxml
    pip install lxml
    
    1. 如果你的环境中同时安装了lxml和etree库,可能会出现冲突。你可以尝试只保留一个库,或者更新这两个库到最新版本。
    2. 在你的代码中,如果你使用的是LXML作为解析器,但是在你的环境中并没有安装LXML库,那么你需要先安装LXML库。安装完成后,你的代码应该能够正常运行。你可以使用以下命令来安装LXML:
    pip install lxml
    

    然后,在你的代码中,你可以这样指定使用LXML作为解析器:

    soup = BeautifulSoup(html, "lxml")
    

    关于你的代码部分,我发现一处可能的错误。在你的代码中,你使用了变量名all_titles,但是在你的代码中并没有定义这个变量。你应该使用alttitles这个变量名来遍历和打印标题。以下是修正后的代码:

    for title in alttitles: 
        title_string = title.string 
        if " / " not in title_string: 
            print(title_string)
    

    希望这些解决方案能够帮助你解决问题。如果问题仍然存在,请提供更多的错误信息和代码片段,以便我能更准确地帮助你解决问题。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 8月2日
  • 已采纳回答 7月25日
  • 创建了问题 7月25日

悬赏问题

  • ¥15 如何制作永久二维码,最好是微信也可以扫开的。(相关搜索:管理系统)
  • ¥15 delphi indy cookie 有效期
  • ¥15 labelme打不开怎么办
  • ¥35 按照图片上的两个任务要求,用keil5写出运行代码,并在proteus上仿真成功,🙏
  • ¥15 免费的电脑视频剪辑类软件如何盈利
  • ¥30 MPI读入tif文件并将文件路径分配给各进程时遇到问题
  • ¥15 pycharm中导入模块出错
  • ¥20 Ros2 moveit2 Windows环境配置,有偿,价格可商议。
  • ¥15 有关“完美的代价”问题的代码漏洞
  • ¥15 请帮我看一下这个简易化学配平器的逻辑有什么问题吗?