运行框中没有爬出来的数据

!pip install openpyxl
import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook
def get_search_list(keyword=None,page=1):
    url ='http://www.mailiangwang.com/biz/list'
    payload ={'keyword':keyword, 'pageid':page}
    response = requests.get(url,params=payload)
    print(response.url)
    print(response.status_code)
get_search_list(u'玉米',1)
name_total = []
caption_total = []
addr_total = []
category_total = []
def get_search_list(keyword=None,page=1):
    url ='http://www.mailiangwang.com/biz/list'
    payload ={'keyword':keyword, 'pageid':page}
    response = requests.get(url,params=payload)
    soup = BeautifulSoup(response.text,'lxml')
    links = soup.select('body>div.wrap >div.merchantList >div.p_dataList >div.p_dataItem >span.n1 >a')
    captions = soup.select('body > div.wrap > divmerchanList > div.p_dataList > div.p_dataIlem > span.n4')
    addrs = soup.select('body > div.wrap >div.merchanList >div.p_dataList >div.p_dataItem > span.n5')
    categories = soup.select('body > div.wrap >div.merchantList >div.p_dataItem >span.n6')
    for link,caption,addr,category in zip(links, captions, addrs, categories):
        name_total.append(link.get('title').strip())
        caption_total.append(caption.text)
        addr_total.append(addr.text)
        category_total.append(category.text)
get_search_list('玉米',1)
print(name_total)
print(caption_total)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

无味33 2021-10-18 20:52

关注

!pip install openpyxl
import requests
from bs4 import BeautifulSoup
from openpyxl import Workbook
def get_search_list(keyword=None,page=1):
    url ='http://www.mailiangwang.com/biz/list'
    payload ={'keyword':keyword, 'pageid':page}
    response = requests.get(url,params=payload)
    print(response.url)
    print(response.status_code)
get_search_list(u'玉米',1)
name_total = []
caption_total = []
addr_total = []
category_total = []
def get_search_list(keyword=None,page=1):
    url ='http://www.mailiangwang.com/biz/list'
    payload ={'keyword':keyword, 'pageid':page}
    response = requests.get(url,params=payload)
    soup = BeautifulSoup(response.text,'lxml')
    links = soup.select('body>div.wrap >div.merchantList >div.p_dataList >div.p_dataItem >span.n1 >a')
captions = soup.select('body > div.wrap > div.merchantList > div.p_dataList > div.p_dataItem > span.n4')
    addrs = soup.select('body > div.wrap > div.merchantList >div.p_dataList >div.p_dataItem > span.n5')
    categories = soup.select('body > div.wrap > div.merchantList >div.p_dataList >div.p_dataItem >span.n6')
    for link,caption,addr,category in zip(links, captions, addrs, categories):
        name_total.append(link.get('title').strip())
        caption_total.append(caption.text)
        addr_total.append(addr.text)
        category_total.append(category.text)
get_search_list('玉米',1)
print(name_total)
print(caption_total)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

Python网络爬虫中json解析失败 json python 有问必答爬虫
2022-02-26 20:51

回答 2 已采纳这个接口返回的是jsonp数据，不是json，要获取text替换掉回调函数名称和前后的括号后才是json数据
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
为什么爬虫运行后什么也没有 python
2021-12-18 20:20

回答 2 已采纳可能list是空的,没有进for
Python 网络爬虫及数据可视化
2021-01-11 18:47

BoBo玩ROS的博客 1.1 Python的优势 2 1.2 网络爬虫 2 1.3 数据可视化 2 1.4 Python环境介绍 2 1.4.1 简介 2 1.4.2 特点 3 1.5 扩展库介绍 3 1.5.1 安装模块 3 1.5.2 主要模块介绍 3 ① pandas模块 3 ② requests模块 4 ③ bs4模块 4 ...
Python3.10.4中input函数回车不运行print python
2022-05-03 20:55

回答 2 已采纳你的代码本身没有问题，相同的代码可以运行并得到你想要的结果
python爬虫关于xpath提取出来为空列表的问题 python 有问必答爬虫
2021-09-30 17:40

回答 2 已采纳你检查下这个网页中的内容是不是通过js代码读取外部json数据来动态更新的。requests只能获取网页的静态源代码，动态更新的内容取不到。对于动态更新的内容要用selenium 来爬取。或者是通
python提取excel中的特定数据 python
2022-04-09 00:12

回答 2 已采纳 import pandas as pd df=pd.read_excel('abc.xlsx') df=df.filter(regex='销售数据',axis=1) df.to_excel('bcd.
Python 网络爬虫与数据采集（一）
2022-01-30 21:28

秃顶的博客 Python 网络爬虫与数据采集第1章序章网络爬虫基础1 爬虫基本概述1.1 爬虫是什么1.2 爬虫可以做什么1.3 爬虫的分类1.4 爬虫的基本流程1.4.1 浏览网页的流程1.4.2 爬虫的基本流程1.5 爬虫与反爬虫1.5.1 爬虫的攻与防...
vscode python 运行程序后没有输出结果 python vscode 有问必答
2022-03-16 20:36

回答 2 已采纳文件中的代码是什么？有没有输出语句？是否有定义方法，然而方法并没有调用。
python爬虫初学，运行不报错但是没有结果？ python 有问必答
2021-04-01 16:51

回答 4 已采纳代码问题：1.request少写了s。 2. fillUnivList(ulist,html)函数没有return。 3.printUnivList(ulist,num)缺少异常处理。 4
python爬虫如何自动获取Network中的某个XHR地址？ python 爬虫网络
2018-08-25 08:43

回答 4 已采纳楼主问的可能有点不清楚，我的理解是：https://zh.flightaware.com/live/airport/+{机场代号} 楼主有几千个机场代号，需要爬取这几千个URL的https://zh
使用Python构建网络爬虫：从网页中提取数据
2023-09-19 00:41

海拥✘的博客 Python是一个流行的编程语言，具有丰富的库和框架，使得构建和运行网络爬虫变得相对容易。本文将深入探讨如何使用Python构建一个简单的网络爬虫，以从网页中提取信息。网络爬虫是一项强大的技术，可用于从互联网上的...
Python爬虫配合VPN爬取出现报错 python 爬虫
2021-12-22 17:33

回答 1 已采纳你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。
完整python项目，python爬虫爬取今日头条后台数据，使用flask框架。html实现前端
2017-09-30 09:42

完整python项目，可以自己运行。利用python爬虫爬取今日头条后台数据。然后使用flask框架实现自己的后台，通过爬虫获取今日头条数据。html实现前端显示数据。网站UI一级界面自己实现，仿照今日头条网站
【Python】Django中运行scrapy框架，并将数据存入数据库
2022-06-23 16:26

浪荡子爱自由的博客项目名.settings django.setup() 4、warehouse下的model.py中创建数据库，用来存储爬到的数据。并在终端执行命令python manage.py makemigrations和 python manage.py migrate，生成数据库表。 from django.db ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 10月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月18日

悬赏问题

¥17 pro*C预编译“闪回查询”报错SCN不能识别
¥15 微信会员卡接入微信支付商户号收款
¥15 如何获取烟草零售终端数据
¥15 数学建模招标中位数问题
¥15 phython路径名过长报错不知道什么问题
¥15 深度学习中模型转换该怎么实现
¥15 HLs设计手写数字识别程序编译通不过
¥15 Stata外部命令安装问题求帮助！
¥15 从键盘随机输入A-H中的一串字符串，用七段数码管方法进行绘制。提交代码及运行截图。
¥15 TYPCE母转母，插入认方向

运行框中没有爬出来的数据

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新