怎么把爬取下来的数据输出为CSV文化呀？自己弄老是不成功

爬取拉勾网源代码如下

from  selenium import webdriver
import requests
from lxml import etree
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.by import By
import time
import re

class lagouSpitder(object):
    driver_path=r'C:\Users\哥斯拉\AppData\Local\Google\Chrome\Application\chromedriver.exe'
    def __init__(self):
        self.driver=webdriver.Chrome(executable_path=lagouSpitder.driver_path)
        self.url='https://www.lagou.com/jobs/list_python/p-city_0?&cl=false&fromSearch=true&labelWords=&suginput='
        self.positions=[]

    def run(self):  #主页面
        self.driver.get(self.url)
        while True:
            source = self.driver.page_source  # source页面来源  先获取一页
            WebDriverWait(driver=self.driver,timeout=10).until(
                EC.presence_of_element_located((By.XPATH,'//span[@action="next"]'))
            )  #等待按钮加载出来
            self.parse_list_page(source)  # 解析完获取的一页之后，去点击下一页
            next_btn = self.driver.find_element_by_xpath('//span[@action="next"]')
            if "pager_next pager_next_disabled" in next_btn.get_attribute('class'):  # 如果class等于最后一页则停止，否则继续点击
                break
            else:
                next_btn.click()
                time.sleep(1)

    def parse_list_page(self,source):  #获取职位详情页url
        html=etree.HTML(source)
        links=html.xpath('//a[@class="position_link"]/@href')
        for link in links:
            self.request_detall_page(link)
            time.sleep(2)

    def request_detall_page(self,url):  #去请求细节页面 这里面得url等于self.request_detall_page里面传递得link
        # self.driver.get(url)
        self.driver.execute_script("window.open('%s')"%url)  #新打开一个职位页面
        self.driver.switch_to_window(self.driver.window_handles[1]) #切换到当前页面
        source=self.driver.page_source  #source页面来源
        self.pares_detail_page(source)   #解析页面
        self.driver.close()   #解析完关闭页面
        self.driver.switch_to_window(self.driver.window_handles[0])

    def pares_detail_page(self,source): #获取职位细节信息
        html=etree.HTML(source)
        Position_name=html.xpath('//span[@class="position-head-wrap-position-name"]/text()')[0] #职位名字
        salary=html.xpath('//span[@class="salary"]/text()')[0] #薪水
        Position_the_temptation=html.xpath('//dd[@class="job-advantage"]/p/text()')[0]   #职位诱惑
        Job_description=html.xpath('//div[@class="job-detail"]//text()')  #职位详情
        # Job_description=re.sub(r'[\s/]','',Job_description)
        desc=''.join(html.xpath('//div[@class="job-detail"]//text()')).strip()   #拼接
        work_address=html.xpath('//div[@class="work_addr"]//text()')[3] #工作地址
        CompanyName = html.xpath('//h3[@class="fl"]/em/text()')[0]  # 公司名字
        Company_Basic_Information=html.xpath('//li/h4/text()')  #公司基本信息

        position={
            '职位名字':Position_name,
            '薪水':salary,
            '职位诱惑':Position_the_temptation,
            '职位详情':Job_description,
            '工作地址':work_address,
            '公司名字': CompanyName,
            '公司基本信息':Company_Basic_Information,
        }
        self.positions.append(position)
        print(position)
        print('='*40)







if __name__ == '__main__':
    spider=lagouSpitder()   #爬虫spider
    spider.run()

麻烦帮忙看下怎么保存为CSV文件，完善一下代码，本人不是很懂
麻烦了

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
qq_42674918 2021-10-11 15:13
关注
import pandas as pd r = pd.DataFrame(positions, columns=['职位名字', '薪水', '职位诱惑', '职位详情', '工作地址', '公司名字', '公司基本信息']) r.to_csv(r"csv路径", index=0)
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

请问Python爬虫如何把爬取数据存入csv文件中 python 开发语言有问必答爬虫
2021-11-21 21:19

回答 1 已采纳你用open打开csv文件，然后以字符串格式写入就行了，每个数据之间用英文逗号隔开即可
python爬虫代码运行不报错，但是保存到CSV的数据为空，是哪里出了问题 python
2022-08-09 16:38

回答 8 已采纳 respone.text获取的json数据格式有问题,用 json.loads(respone.text)解析出错另外写csv文件的代码要放到for循环外面,所有数据获取之后再一起写入 cit
怎么将Python的运行结果导出为csv格式？ python sklearn 有问必答
2021-12-01 11:17

回答 2 已采纳可以先转换为dataframe，再用to_csv保存即可。示例： import pandas as pd import numpy as np a=np.array([[2,3,4],[1,2,3]
python爬取下来的数据保存csv文件怎么加title_用python（Requests库）爬取数据局行业报告的信息...
2020-11-22 17:42

weixin_39915820的博客作为一个刚入门对python极具喜爱的小白，坚信实践才是掌握工具的唯一道路，所以一直想要用python来做一些项目来辅助提高工作、生活中的处理一些事情的效率。在平时的工作中，总是难免会需要搜集各种各样的行业研究...
为什么用python 爬取数据到excel中300多行只剩下一行？ python vscode 开发语言有问必答
2021-08-01 12:32

回答 4 已采纳将写入文件语句放到循环外，加上列名并逐行写入，后面的代码可以这样写： #code with open('data/51job.csv','w') as f: f.write(','.join(
python 如何根据csv表格筛选数据？ python
2022-04-03 03:07

回答 5 已采纳 res = [] with open("aa.csv",'rt') as r: for line in r: line=line.strip()
怎么用python编写一段程序，将如下的数据存储为CSV格式？ python 有问必答
2021-05-22 15:51

回答 4 已采纳 import csv arr = [ ["省市名称","电话区号"], ["北京市","010"], ["上海市","021"], ["天津市","022"],
使用 Python 爬取天气数据并保存至 CSV
2024-04-19 10:35

呆萌宝儿姐的博客虽然有许多天气预报网站和应用程序可以提供天气信息，但有时我们需要的是历史天气数据，而这些数据并不总是可以轻易获得。因此，我们可以利用网络爬虫技术，通过编写程序从天气网站上获取历史天气数据，并将其保存至...
怎样在Python csv文件中每24行提取一次数据并保存到一个单独的csv文件中？ python 有问必答
2022-04-08 03:39

回答 4 已采纳不需要每隔24行数据单独保存到一个文件，只需要用列表切片每隔24行切成为一个列表,把切片出来的列表作为一个元素添加到一个li2列表中.用random.shuffle(li2)随机打乱li2,再合并写到
python 爬取表格获取不到数据 python
2020-02-17 22:52

回答 4 已采纳爬取需要在请求头里面添加Host，要不然爬取不到任何信息，另外源码是不规则的html代码，所以需要指定html解析器 ``` # -*- coding：utf-8 -*- import os
python爬取软科排名,匹配不到数据 python 数据挖掘爬虫
2022-03-24 21:35

回答 1 已采纳我这里是可以正常运行的
Python爬取所有股票数据并进行数据分析
2019-04-13 14:47

MLDan的博客一、背景：作为一个程序员，总喜欢在股市里面晃荡，无奈总是当成韭菜收割了。每一次都是卖涨买跌，处处碰壁。但是作为一个有一定阅历的程序员本能告诉自己，只要掌握了大量的股票数据，就可以在信息渠道落后的情况下...
2024年Python最全Python爬取去哪网旅游景点保存到csv文件
2024-04-30 20:45

2401_84585205的博客 csv_writer = csv.DictWriter(f, fieldnames=[‘景区名字’, ‘景区等级’, ‘地区’, ...f = open(‘旅游景点.csv’, mode=‘a’, encoding=‘utf-8-sig’, newline=‘’)⑤ Python学习路线图（告别不入流的学习）
Python爬取天气数据及可视化分析！
2022-04-05 09:00

俊红的数据分析之路的博客来源丨Python之王Python爬取天气数据及可视化分析说在前面天气预报我们...本次使用python中requests和BeautifulSoup库对中国天气网当天和未来14天的数据进行爬取，保存为csv文件，之后用matplotlib、numpy、pandas...
python爬取行业数据_用python（Requests库）爬取数据局行业报告的信息
2020-12-02 21:15

weixin_39968410的博客作为一个刚入门对python极具喜爱的小白，坚信实践才是掌握工具的唯一道路，所以一直想要用python来做一些项目来辅助提高工作、生活中的处理一些事情的效率。在平时的工作中，总是难免会需要搜集各种各样的行业研究...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月19日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月11日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月11日

悬赏问题

¥30 Matlab打开默认名称带有/的光谱数据
¥50 easyExcel模板动态单元格合并列
¥15 res.rows如何取值使用
¥15 在odoo17开发环境中，怎么实现库存管理系统，或独立模块设计与AGV小车对接？开发方面应如何设计和开发？请详细解释MES或WMS在与AGV小车对接时需完成的设计和开发
¥15 CSP算法实现EEG特征提取，哪一步错了？
¥15 游戏盾如何溯源服务器真实ip?需要30个字。后面的字是凑数的
¥15 vue3前端取消收藏的不会引用collectId
¥15 delphi7 HMAC_SHA256方式加密
¥15 关于#qt#的问题：我想实现qcustomplot完成坐标轴
¥15 下列c语言代码为何输出了多余的空格

怎么把爬取下来的数据输出为CSV文化呀？自己弄老是不成功

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新