看破、点不破 2022-07-20 16:54 采纳率: 100%
浏览 55
已结题

python爬虫数据显示问题



```python
from pyquery import PyQuery as pq
import requests
import csv

def download_page_source(url):   #请求源代码
 resp = requests.get(url)
 resp.encoding = "utf-8"
 return resp.text
#  return resp.text
dic ={}

def parse_data(source):
    query = pq(source)
    divs = query(".cm-content-box").items()
    for div in divs:
        chezhuname = div("div>div>a>div>div>span:nth-child(1)").text()
        chexing = div("div > a >div:nth-child(1)>div:nth-child(1)>p").text()
        carmoney= div("div > a >div:nth-child(1)>div:nth-child(1)>div>span:nth-child(2)>span:nth-child(2)").text()
        youhao = div("div > a >div:nth-child(1)>div:nth-child(1)>div>span:nth-child(3)").text()
        time =div("div > a >div:nth-child(1)>div:nth-child(1)>div>span:nth-child(4)>span:nth-child(2)").text()
        print(time,chezhuname)
 
        
     def main(url):
    page_source = download_page_source(url) 
    parse_data(page_source)

if __name__ == '__main__':
 url = "https://dianping.yiche.com/songplusdm/koubei/"

 main(url)



如何将爬虫到的数据一行一行对应出来,并且保存到csv格式文件中
格式如下:
车主:新宋婆 车型:宋PLUS新能源 2021款 DM-i 1.5L 两驱 旗舰PLUS 裸车价:19.98万 油耗 2.8L/100km 购车时间:2022-01


我现在输出单个数据的显示不是一一对应的,而是散乱的。

如图:
![img](https://img-mid.csdnimg.cn/release/static/image/mid/ask/242613703856129.png "#left")
  • 写回答

3条回答 默认 最新

  • 快乐小土狗 2022-07-20 17:00
    关注

    首先,你这里写错了
    divs = query(".cm-content-box").items()

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 7月28日
  • 已采纳回答 7月20日
  • 修改了问题 7月20日
  • 创建了问题 7月20日

悬赏问题

  • ¥15 Stata链式中介效应代码修改
  • ¥15 latex投稿显示click download
  • ¥15 请问读取环境变量文件失败是什么原因?
  • ¥15 在若依框架下实现人脸识别
  • ¥15 添加组件无法加载页面,某块加载卡住
  • ¥15 网络科学导论,网络控制
  • ¥15 利用Sentinel-2和Landsat8做一个水库的长时序NDVI的对比,为什么Snetinel-2计算的结果最小值特别小,而Lansat8就很平均
  • ¥15 metadata提取的PDF元数据,如何转换为一个Excel
  • ¥15 关于arduino编程toCharArray()函数的使用
  • ¥100 vc++混合CEF采用CLR方式编译报错