weixin_46076702 2020-07-31 18:49 采纳率: 0%
浏览 177

python中,爬取数据时怎么让没有的数据用'/ '或者空字符代替,让列表上的资料输出到表格中时能够全面,没有的数据空出来就好,不要让数据错位

import requests
from lxml import etree
url='http://www.cargoyellowpages.com/en/jordan/amman/page_01.html'
headers={'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36'}
names=[]
tels=[]
list=[]
page_text=requests.get(url=url,headers=headers).text#得到网页信息
tree=etree.HTML(page_text)
companys = tree.xpath('//*[@id="content_style"]/div[2]/div[7]/div')#找到当前页面公司所在div

for company in companys:#遍历公司
try:
name = company.xpath('./div/div[1]/h2/span/a/text()')[0]#找到公司名称
names.append(name)#添加到公司名称列表
tel = company.xpath('./div/div[5]/text()')[0]#找到公司电话
tels.append(tel)#添加到电话列表
list.append([name,tel])
except:
pass
print(len(names))
print(len(tels))
print(len(list))

  • 写回答

1条回答 默认 最新

  • dabocaiqq 2020-08-01 12:44
    关注
    评论

报告相同问题?

悬赏问题

  • ¥15 我想在WPF的Model Code中获取ViewModel Code中的一个参数
  • ¥15 arcgis处理土地利用道路 建筑 林地分类
  • ¥20 使用visual studio 工具用C++语音,调用openslsx库读取excel文件的sheet问题
  • ¥100 寻会做云闪付tn转h5支付链接的技术
  • ¥15 DockerSwarm跨节点无法访问问题
  • ¥15 使用dify通过OpenAI 的API keys添加OpenAI模型时报了“Connection Error”错误
  • ¥40 想找个软件,但我不知道怎么找到它,我甚至不知道有没有
  • ¥15 怎么把60秒的视频时长改成显示0秒?且视频内容没有任何变化的正常播放?目的是为了解决一些平台对视频时长的要求,最好有自动处理的工具!
  • ¥15 累加器设初值为00H
  • ¥15 webAPI接口返回值判断