weixin_69932367 2023-06-02 14:30 采纳率: 83.3%
浏览 62
已结题

有一个python爬虫的问题

怎么才能实现把网页里的10篇文章用txt文档保存到工作目录里

  • 写回答

5条回答 默认 最新

  • CSDN专家-showbo 2023-06-02 14:49
    关注

    示例代码如下

    import requests
    from bs4 import BeautifulSoup
    
    html=requests.get('https://www.pythontab.com/html/pythonjichu/').text
    soup=BeautifulSoup(html,'html.parser')
    items=[]
    alist=soup.select('#catlist a')
    for a in alist:
        href=a['href']
        html=requests.get(href).text#获取文章详情
        soup=BeautifulSoup(html,'html.parser')
        item={}
        title=soup.select('h1')[0].text#标题
        content=soup.select('#Article .content')[0].text#内容
        item['url']=href
        item['title']=title
        item['content']=content
        items.append(item)
    
    with open('articles.txt','w',encoding='utf-8') as f:
        for item in items:
            f.write('网址:'+item['url']+'\n')
            f.write('标题:'+item['title']+'\n')
            f.write('内容\n'+item['content']+'\n\n\n')
    
    
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(4条)

报告相同问题?

问题事件

  • 系统已结题 6月10日
  • 已采纳回答 6月2日
  • 修改了问题 6月2日
  • 创建了问题 6月2日