Node.js + request + cheerio 爬取数据出现问题

我在用node爬取数据，用了request模块和cheerio模块，我在获取到了一个url后，用数组获取到了该url下的分页（假设为1-10），但是当打印数据后，发现只获取到了分页1下的数据

 for (var i = data.start; i <= data.end; i++) {
        var newUrl;
        if ( i == 1 ) {
            newUrl = data.url;
        } else {
            newUrl = data.url + '#!hot-p' + i;
        }
        urlList.push(newUrl);
    }
    async.eachSeries(urlList, function(elem, callback){
        //requestUrl(elem, data.tag, callback);
        request(elem, function(err, res){
            var $ = cheerio.load(res.body.toString());
            var j = $('.j');
            var a = j.find('.a').toArray();
            var hrefArray = [];
            for (var i=0;i< a.length;i++){
                var that = $(a[i]);
                var aHref = that.attr('href');
                var urls = 'http://www.duitang.com' + aHref;
                hrefArray.push(urls);
            }
            console.log(hrefArray);
            callback();
        });
    }, function(err){
        if (err) {
            console.log(err);
        }else{
            console.log('已完成全部抓取!');
        }
        callback();
    });

 console.log(hrefArray);
打印出来的数据全是分页1下的数据，请问这是为什么？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
devmiao 2016-04-12 15:50
关注
http://blog.csdn.net/kavensu/article/details/17851241

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

使用 Node.js 和 Cheerio 爬取网站图片
2024-01-29 15:37

随风小薇的博客写一个关于图片爬取的小案例爬取效果新建一个config.js配置文件找到需要下载的文件原元素位置请注意，上述示例中的 https://example.com 是一个示例网站的 URL，你需要替换为你要爬取图片的实际网站 URL。...
Node.js-简单的安居客爬虫爬取经纪人信息
2019-08-10 05:17

Node.js是一个基于Chrome V8引擎的JavaScript运行环境，它允许开发者在服务器端使用JavaScript编写代码。由于JavaScript在浏览器端的广泛使用，开发者可以轻松地将前端技能应用于后端开发，提高了开发效率。在Node...
Node+Cheerio+Express+Vue+Request完成页面抓取
2025-05-19 09:59

苦逼的猿宝的博客应用使用了request模块发送HTTP请求，cheerio模块解析HTML文档，并定义了多个函数分别提取评分、推荐和景点数据。数据整合后通过/data路由返回给客户端。前端部分通过Vue框架展示数据，并使用ECharts生成饼图展示...
使用 node.js 爬取页面数据
2022-10-24 15:31

L494_的博客使用 node.js 爬取数据爬虫
node.js基础学习-cheerio模块-简单小爬虫（五）
2024-11-29 15:36

前端程序员_花姐夫Jun的博客学习cheerio模块，简单做一个爬取图片网站的图片，并且将这些图片下载到本地指定的文件夹下，很多图片网站都有一些反爬取的机制，找的好几个都会报302错误，所以我找了一个小的图片网站，这个没有反爬取机制，实现了...
利用Node.js实现拉勾网数据爬取
2024-04-01 16:20

小白学大数据的博客接下来，我们使用Node.js中的request模块发送POST请求，获取到拉勾网返回的JSON格式的职位列表数据。首先，我们使用浏览器的开发者工具分析拉勾网的网络请求，找到了职位信息的请求URL和必要的请求头信息。
Node.js爬取网站数据+生成excel+发送邮箱+定时发送
2022-10-19 09:16

烟花易冷，夜未凉的博客 node.js, 爬虫，自动定时，发送邮箱
Node.js-小爬虫爬取美女图片
2019-08-10 05:17

Node.js允许开发者在服务器端使用JavaScript，这使得前端和后端开发可以使用同一门语言，提高了开发效率。它内置了V8引擎，使得JavaScript代码运行速度非常快。此外，Node.js拥有丰富的生态系统，通过npm（Node ...
用nodejs的request和cheerio模块爬取网页和图片
2022-06-27 11:03

wudics的博客 var request = require('request'); var cheerio = require('cheerio'); var artlist = []; var prefixurl = "https://www.jb51.net"; var url = prefixurl + "/list/list_15_1.htm"; request({ url: url, method: ...
Web编程期末项目——node.js爬虫+Express+Vue3
2023-07-21 03:58

zpxo99的博客从下往上，数据访问层主要是由node.js爬取出的新闻信息汇总成的mysql信息表，业务逻辑层是由Express框架组成的，包含作图接口和查询接口，表现层的视图层由三剑客和elementplus构成，交互层由vue.js框架中的vue容器...
node.js学习笔记(3)——使用cheerio处理爬取的网页内容
2018-09-18 18:42

水宁成冰的博客 node.js本身自带爬取网站网页内容的功能。 var http = require('http'); router.get('/test', function(req, res){ var url = 'http://www.baidu.com'; http.get(url, function(response){ var html = ''; ...
Node.js-一个简单的播放器从数据爬取处理到上传至七牛云再到前端页面展示
2019-08-10 05:28

总结，这个项目展示了如何利用 Node.js 完成从数据爬取、处理、上传至云端存储，再到前端页面展示的完整流程。涉及的技术包括 HTTP 请求、数据处理、对象存储服务以及前端页面构建，这些都是现代 Web 开发中的基础...
简单易学！使用 Node.js 编写爬虫，跟着教程一步步实现！
2023-06-01 11:09

踏浪而行foreval的博客爬虫是一种可以自动从网页上获取数据的程序，它可以帮助我们收集和分析各种有用的信息。在这篇文章中，我将向你展示如何用 node.js 来编写一个简单的爬虫，只需几步就可以实现。
前端之使用NodeJS+Cheerio实现网络爬虫图解
2022-09-01 09:58

梦远星帆的博客图解使用NodeJS+Cheerio实现网络爬虫来进行数据爬取使用。
Node.js获取疫情数据并写入数据库mysql中
2021-09-28 14:25

GIS_宇宙的博客 // 目标是爬取丁香园网站的疫情数据 // 在node端要有一个帮助我请求丁香园网站 const superagent = require('superagent') const cheerio = require('cheerio') const mysql =require('mysql') const path = require...
了不起的Node.js【1】——了解Node.js+爬虫demo
2018-03-29 17:10

一颗语法糖的博客什么是Node.js 为什么学习Node.js 什么时候选择Node.js 第一个服务器模块与包管理工具【实例】一个Node爬虫总结本篇博文内容参考慕课网的课程如下：进击Node.js基础（一）创业公司的Nodejs工程师有...
这是一个基于node.js的小说爬虫系统，后台数据库采用的是mongodb.zip
2023-08-03 21:20

开发者需要熟悉Node.js的模块系统，如Express框架用于构建web应用，axios或request库用于HTTP请求，cheerio库用于解析HTML并提取数据。 2. **网页爬虫**：在Node.js中实现小说爬虫，可能使用了像axios这样的库来...
Node.js数据抓取实战：从API网站获取数据
2025-07-09 00:04

阿卞是宝藏啊的博客 Node.js是构建在Chrome V8引擎之上的一个JavaScript运行环境，允许开发者使用JavaScript进行服务器端编程。其独特之处在于它采用了事件驱动和非阻塞I/O模型，这使得它在处理大量并发连接时特别有效，尤其是在网络...
node.js爬虫爬取数据并渲染到页面
2021-06-21 16:51

管理界的扫地僧的博客 const express = require("express") ...const cheerio = require("cheerio") var app = express() // 后端没有window // 设置静态资源目录 app.use(express.static(__dirname+"/public")) request({ url: 'http.
没有解决我的问题, 去提问

Node.js + request + cheerio 爬取数据出现问题

1条回答 默认 最新

1条回答默认最新