12ewsdx 2019-08-04 19:19 采纳率: 0%
浏览 824

nodejs采集替换内容文字?

const http = require('https');
const fs = require('fs');
http.get('https://baidu.com',(res)=>{
//res is the response

res.setEncoding('binary');//treat res as the binary without thinking about the enconding
var body = '';
res.on('data',(chunk)=>{
body+=chunk;
});

res.on('end',()=>{
fs.writeFile('./xxxx.js',body,'binary',()=>{
console.log('collection is completed');
});
});
});

上面代码直接整页生成。如果要在采集的时候把部分关键词替换能直接做得到。还是需要其它脚本。比如把“百度”关键词改成“千度”

  • 写回答

1条回答 默认 最新

  • supervillain2 2023-06-08 17:29
    关注
    
    const http = require('https');
    const fs = require('fs');
    http.get('https://baidu.com',(res)=>{
        res.setEncoding('binary');
    
        let body = '';
    
        res.on('data',(chunk)=>{
            // 在这里替换关键词
            chunk = chunk.replace(/百度/g, '千度');
            body+=chunk;
        });
    
        res.on('end',()=>{
            fs.writeFile('./xxxx.js',body,'binary',()=>{
                console.log('collection is completed');
            });
        });
    });
    
    
    评论

报告相同问题?

悬赏问题

  • ¥15 三菱伺服电机按启动按钮有使能但不动作
  • ¥20 为什么我写出来的绘图程序是这样的,有没有lao哥改一下
  • ¥15 js,页面2返回页面1时定位进入的设备
  • ¥200 关于#c++#的问题,请各位专家解答!网站的邀请码
  • ¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
  • ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
  • ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
  • ¥20 腾讯企业邮箱邮件可以恢复么
  • ¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗?
  • ¥15 错误 LNK2001 无法解析的外部符号