赵大笨笨 2024-01-29 17:32 采纳率: 0%
浏览 6

Java 无法爬取TB商品

Java 爬取指定店铺的所有商品信息只能获取外层div,商品列表应该是动态生成的,抓取不到。哪位谁可以帮帮忙

img


只能到取到选中的div内容取不到

  • 写回答

2条回答 默认 最新

  • 叫兽-郭老师 Java领域新星创作者 2024-01-29 17:38
    关注

    淘宝现在抓商品可不好抓哦,很多反爬虫措施。我用python试过。
    至于java,我觉得你应该直接用淘宝页面的url,然后分析页面。

    public static void main(String[] args) throws Exception {
     String html = sendGetRequest(url);
    }
    /***
         * get请求
         * @param url
         * @return
         * @throws IOException
         */
        private static String sendGetRequest(String url) throws IOException {
            URL obj = new URL(url);
            HttpURLConnection connection = (HttpURLConnection) obj.openConnection();
    
            // 设置请求方法为GET
            connection.setRequestMethod("GET");
    
            // 获取响应码
            int responseCode = connection.getResponseCode();
            System.out.println("Response Code: " + responseCode);
    
            // 读取响应内容
            BufferedReader in = new BufferedReader(new InputStreamReader(connection.getInputStream()));
            String inputLine;
            StringBuilder response = new StringBuilder();
    
            while ((inputLine = in.readLine()) != null) {
                response.append(inputLine);
            }
            in.close();
    
            return response.toString();
        }
    
    
    
    评论

报告相同问题?

问题事件

  • 创建了问题 1月29日

悬赏问题

  • ¥15 依据报错在原代吗格式的基础上解决问题
  • ¥15 在虚拟机中安装flash code
  • ¥15 单片机stm32f10x编写光敏电阻调节3.3伏大功率灯亮度(光强越大灯越暗,白天正常光强灯不亮,使用ADC,PWM等模块)望各位找一下错误或者提供一个可实现功能的代码
  • ¥20 verilog状态机方法流水灯
  • ¥15 pandas代码实现不了意图
  • ¥15 GD32H7 从存储器到外设SPI传输数据无法重复启用DMA
  • ¥25 LT码在高斯信道下的误码率仿真
  • ¥45 渲染完成之后将物体的材质贴图改变,自动化进行这个操作
  • ¥15 yolov5目标检测并显示目标出现的时间或视频帧
  • ¥15 电视版的优酷可以设置电影连续播放吗?