12ewsdx 2019-08-04 19:19 采纳率: 0%
浏览 824

nodejs采集替换内容文字?

const http = require('https');
const fs = require('fs');
http.get('https://baidu.com',(res)=>{
//res is the response

res.setEncoding('binary');//treat res as the binary without thinking about the enconding
var body = '';
res.on('data',(chunk)=>{
body+=chunk;
});

res.on('end',()=>{
fs.writeFile('./xxxx.js',body,'binary',()=>{
console.log('collection is completed');
});
});
});

上面代码直接整页生成。如果要在采集的时候把部分关键词替换能直接做得到。还是需要其它脚本。比如把“百度”关键词改成“千度”

  • 写回答

1条回答 默认 最新

  • supervillain2 2023-06-08 17:29
    关注
    
    const http = require('https');
    const fs = require('fs');
    http.get('https://baidu.com',(res)=>{
        res.setEncoding('binary');
    
        let body = '';
    
        res.on('data',(chunk)=>{
            // 在这里替换关键词
            chunk = chunk.replace(/百度/g, '千度');
            body+=chunk;
        });
    
        res.on('end',()=>{
            fs.writeFile('./xxxx.js',body,'binary',()=>{
                console.log('collection is completed');
            });
        });
    });
    
    
    评论

报告相同问题?

悬赏问题

  • ¥50 树莓派安卓APK系统签名
  • ¥15 maple软件,用solve求反函数出现rootof,怎么办?
  • ¥65 汇编语言除法溢出问题
  • ¥15 Visual Studio问题
  • ¥15 state显示变量是字符串形式,但是仍然红色,无法引用,并显示类型不匹配
  • ¥20 求一个html代码,有偿
  • ¥100 关于使用MATLAB中copularnd函数的问题
  • ¥20 在虚拟机的pycharm上
  • ¥15 jupyterthemes 设置完毕后没有效果
  • ¥15 matlab图像高斯低通滤波