陈啊阵 2024-04-24 16:03 采纳率: 100%
浏览 10
已结题

关于##爬虫##的问题,如何解决?:

#用python爬虫爬取网址https://www.ss911.cn/Pages/NewsInfo_new.ss?id=1045 上的小说内容,小说内容如上图,将爬取到的内容输出到一个txt文件里,要求给出具体详细的代码,并给出运行结果,ai写的没那么好运行!如果链接点不了就看图片里的网址,不用ai并给出运行结果+30....

img

  • 写回答

7条回答 默认 最新

  • 专家-郭老师 Java领域新星创作者 2024-04-24 16:05
    关注

    您好,我已经爬好了,有用的话,请采纳!

    img

    代码:

    
    import requests
    from bs4 import BeautifulSoup
    
    # 发送 GET 请求获取页面内容
    url = "https://www.ss911.cn/Pages/NewsInfo_new.ss?id=1405"
    response = requests.get(url)
    
    # 检查请求是否成功
    if response.status_code == 200:
        # 使用 BeautifulSoup 解析 HTML
        soup = BeautifulSoup(response.text, "html.parser")
        # 找到指定 id 的 div 元素
        content_div = soup.find("div", id="content")
        if content_div:
            # 获取 div 下的文本内容
            content_text = content_div.get_text()
            # 将内容写入到文件中
            with open("content.txt", "w", encoding="utf-8") as file:
                file.write(content_text)
            print("页面内容已保存到 content.txt 文件中。")
        else:
            print("未找到指定的内容元素。")
    else:
        print("页面请求失败,状态码:", response.status_code)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(6条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 4月24日
  • 已采纳回答 4月24日
  • 修改了问题 4月24日
  • 修改了问题 4月24日
  • 展开全部

悬赏问题

  • ¥15 finalshell节点的搭建代码和那个端口代码教程
  • ¥15 用hfss做微带贴片阵列天线的时候分析设置有问题
  • ¥50 我撰写的python爬虫爬不了 要爬的网址有反爬机制
  • ¥15 Centos / PETSc / PETGEM
  • ¥15 centos7.9 IPv6端口telnet和端口监控问题
  • ¥120 计算机网络的新校区组网设计
  • ¥20 完全没有学习过GAN,看了CSDN的一篇文章,里面有代码但是完全不知道如何操作
  • ¥15 使用ue5插件narrative时如何切换关卡也保存叙事任务记录
  • ¥20 海浪数据 南海地区海况数据,波浪数据
  • ¥20 软件测试决策法疑问求解答