python中，爬取数据时怎么让没有的数据用'/ '或者空字符代替，让列表上的资料输出到表格中时能够全面，没有的数据空出来就好，不要让数据错位

import requests
from lxml import etree
url='http://www.cargoyellowpages.com/en/jordan/amman/page_01.html'
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36'}
names=[]
tels=[]
list=[]
page_text=requests.get(url=url,headers=headers).text#得到网页信息
tree=etree.HTML(page_text)
companys = tree.xpath('//*[@id="content_style"]/div[2]/div[7]/div')#找到当前页面公司所在div

for company in companys:#遍历公司
try:
name = company.xpath('./div/div[1]/h2/span/a/text()')[0]#找到公司名称
names.append(name)#添加到公司名称列表
tel = company.xpath('./div/div[5]/text()')[0]#找到公司电话
tels.append(tel)#添加到电话列表
list.append([name,tel])
except:
pass
print(len(names))
print(len(tels))
print(len(list))

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
dabocaiqq 2020-08-01 12:44
关注
https://blog.csdn.net/wglink/article/details/103970593

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

爬取网页表格数据到excel后，excel上没有数据？ python
2023-04-10 02:32

回答 4 已采纳结论：1、你的url是错误的。至少格式上来就错了。（https://liansai.500.com/zuqiu-6296/jifen-17831/2023-04-10&page=1）；2、col2之后
python爬虫爬取到的内容无法输出到txt文档中 python
2022-08-12 12:20

回答 3 已采纳不如换用requests库和bs4库吧。 from bs4 import BeautifulSoup as bs import requests as r url = 'https://fanqie
python 爬取表格获取不到数据 python
2020-02-17 22:52

回答 4 已采纳爬取需要在请求头里面添加Host，要不然爬取不到任何信息，另外源码是不规则的html代码，所以需要指定html解析器 ``` # -*- coding：utf-8 -*- import os
【爬虫+可视化】Python爬取疫情并可视化处理数据（爬虫入门案例）
2022-07-30 18:18

爱吃饼干的小白鼠的博客网络爬虫是一种程序,主要用于搜索引擎,它将一个网站的所有内容与链接进行阅读,并建立相关的全文索引到数据库中,然后跳到另一个网站.样子好像一只大蜘蛛.当人们在网络上(如google)搜索关键字时,其实就是比对数据库中...
为什么用python 爬取数据到excel中300多行只剩下一行？ python vscode 开发语言有问必答
2021-08-01 12:32

回答 4 已采纳将写入文件语句放到循环外，加上列名并逐行写入，后面的代码可以这样写： #code with open('data/51job.csv','w') as f: f.write(','.join(
python爬取数据结果是一个空列表 python 爬虫
2022-11-23 10:22

回答 4 已采纳 import requests from lxml import etree url = 'https://nba.hupu.com/stats/players' headers = {'User
使用selenium爬取数据时，数据没展开提取不到怎么办？ python
2021-03-07 15:54

回答 2 已采纳两个方法一个是找到后端接口，直接请求后端接口另一个是操作selenium点击加载
基于Python的海量豆瓣电影、数据获取、数据预处理、数据分析、可视化、大屏设计项目（含数据库）
2023-06-27 15:05

王小王-123的博客并利用Python的Pandas数据分析库，对获取的数据进行预处理，将非结构化的数据清洗为干净的数据，便于后续的大数据分析，分别对数据进行空值检测与处理，字符串的约束，字段值的扩充，以及数据的清洗。
python使用xpath爬取网络数据报表结果为空 python 开发语言有问必答
2021-10-23 17:12

回答 3 已采纳该页面数据在XHR中找，构建一下headers和params，使用如下方式获json数据，然后从中解析即可： response = requests.get('https://fr.oppein.co
在python爬取数据时,中文数据如何正确存储而不使其丢失和乱码 json python 有问必答
2021-07-21 10:55

回答 3 已采纳在保存为json时，设置参数ensure_ascii=False试试，参考 https://blog.csdn.net/qq_41422774/article/details/97394651
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
6.9 用Python操控数据库（批量删除，百度新闻数据爬取与存储，写入数据时进行去重处理，pandas读取sql数据）
2022-04-12 20:03

Triumph19的博客上一节在phpMyAdmin 中创建了数据库“pachong”，并在其中创建了数据表"test"，那么该如何在Python中连接该数据库，并调用其中的数据表呢？首先安装用于操控MySQL的python第三方库PyMySQL,安装命令为"pip install ...
Python pandas DataFrame数据带中文输出时无法对齐 python
2021-11-10 16:04

回答 3 已采纳问题已经找到解决方法了，只要把Pycharm的字体改为中文字体, 然后加上那两行代码, print输出的DataFrame数据就是对齐的了
python爬取网页公开数据_python抓取网页数据
2020-11-24 10:34

weixin_39999536的博客用python抓取页面并进行处理2009-02-19 15:09:50| 分类： Python | 标签：无 |字号订阅主要目的：抓取某个网页的源代码，把里面需要的数据进行处理，并保存到数据库中。已经实现了抓取页面并读取数据。步骤一、抓取...
Python爬取网页文本数据，从此告别复制粘贴！
2023-11-06 11:29

码农必胜客的博客如何复制网页付费文本资料呢？python网络爬虫一招教你自动生成文本文档
没有解决我的问题, 去提问

悬赏问题

¥15 我想在WPF的Model Code中获取ViewModel Code中的一个参数
¥15 arcgis处理土地利用道路建筑林地分类
¥20 使用visual studio 工具用C++语音，调用openslsx库读取excel文件的sheet问题
¥100 寻会做云闪付tn转h5支付链接的技术
¥15 DockerSwarm跨节点无法访问问题
¥15 使用dify通过OpenAI 的API keys添加OpenAI模型时报了“Connection Error”错误
¥40 想找个软件，但我不知道怎么找到它，我甚至不知道有没有
¥15 怎么把60秒的视频时长改成显示0秒？且视频内容没有任何变化的正常播放？目的是为了解决一些平台对视频时长的要求，最好有自动处理的工具！
¥15 累加器设初值为00H
¥15 webAPI接口返回值判断

python中，爬取数据时怎么让没有的数据用'/ '或者空字符代替，让列表上的资料输出到表格中时能够全面，没有的数据空出来就好，不要让数据错位

1条回答 默认 最新

悬赏问题

1条回答默认最新