尝试使用“ net / http”获取某些图像时，为什么会收到“ net / http：等待连接时请求已取消”的信息

I'm writing a web crawler in Go language to collect images on the Internet. My crawler works most of the time, but it sometimes fails to fetch images somehow.

Here's my snippet:

package main

import (
    "fmt"
    "net/http"
    "time"
)

func main() {
    var client http.Client
    var resp *http.Response

    // var imageUrl = "https://i.stack.imgur.com/tKsDb.png"  // It works well
    var imageUrl = "https://precious.jp/mwimgs/b/1/-/img_b1ec6cf54ff3a4260fb77d3d3de918a5275780.jpg"  // It fails

    req, _ := http.NewRequest("GET", imageUrl, nil)
    req.Header.Add("User-Agent", "My Test")

    client.Timeout = 3 * time.Second
    resp, err := client.Do(req)
    if err != nil {
        fmt.Println(err.Error())  // Fails here
        return
    }
    defer resp.Body.Close()

    if resp.StatusCode != http.StatusOK {
        fmt.Printf("Failure: %d
", resp.StatusCode)
    } else {
        fmt.Printf("Success: %d
", resp.StatusCode)
    }

    fmt.Println("Done")
}

My snippet above works for most of the URLs (e.g. "https://i.stack.imgur.com/tKsDb.png"), but it doesn't work if it tries to fetch URLs such as "https://precious.jp/mwimgs/b/1/-/img_b1ec6cf54ff3a4260fb77d3d3de918a5275780.jpg". Error message given by calling err.Error() is:

Get https://precious.jp/mwimgs/b/1/-/img_b1ec6cf54ff3a4260fb77d3d3de918a5275780.jpg: net/http: request canceled (Client.Timeout exceeded while awaiting headers)"

My Go version is "go1.9.3 darwin/amd64", and I can get the image with my Google Chrome and also with curl command, so I don't think I'm blocked by my IP address. Besides that, I've changed the User-Agent to be like real browser but still not luck.

What's wrong with my code? Or is the administrator of precious.jp doing some magic to block my access?

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

dongzheng7165 2018-01-30 13:57

关注

Since you're using https, you need to create http.Client with custom transport and configure TLS (see http.Transport), e.g.

package main

import (
    "crypto/tls"
    "fmt"
    "net/http"
    "time"
)

func main() {
    //---------------------- Modification ----------------------
    //Configure TLS, etc.
    tr := &http.Transport{
        TLSClientConfig: &tls.Config{
            InsecureSkipVerify: true,
        },
    }
    client := &http.Client{
        Transport: tr,
        Timeout:   3 * time.Second,
    }
    //---------------------- End of Modification ----------------

    // var imageUrl = "https://i.stack.imgur.com/tKsDb.png"  // It works well
    var imageUrl = "https://precious.jp/mwimgs/b/1/-/img_b1ec6cf54ff3a4260fb77d3d3de918a5275780.jpg" // It fails

    req, _ := http.NewRequest("GET", imageUrl, nil)
    req.Header.Add("User-Agent", "My Test")

    resp, err := client.Do(req)
    if err != nil {
        fmt.Println(err.Error()) // Fails here
        return
    }
    defer resp.Body.Close()

    if resp.StatusCode != http.StatusOK {
        fmt.Printf("Failure: %d
", resp.StatusCode)
    } else {
        fmt.Printf("Success: %d
", resp.StatusCode)
    }

    fmt.Println("Done")
}

报告相同问题？

关注问题

C#使用picutreBox循环显示大尺寸图像时会出现断层,显示不完整 c#
2022-10-12 13:57

回答 4 已采纳环境不同，仅供参考【图片太大导致 imageView无法显示】：https://blog.csdn.net/Demon_xiaochunjie/article/details/79424777
图像受噪声干扰严重时为什么不能进行较好的恢复，可采用什么样的方式进行缓解图像处理
2022-12-11 19:48

回答 1 已采纳望采纳在这种情况下，可以采用一些算法来缓解噪声干扰对计算机视觉系统的影响。例如，可以使用图像去噪算法来降低噪声的影响，或者使用模糊滤波器来平滑图像，以提高图像的可识别度。此外，还可以通过增强学习和深度
关于#opencv#的问题：为什么我用sobel算子处理出来图像是这样呢 opencv 图像处理计算机视觉
2023-03-08 13:02

回答 2 已采纳 “Devil组”引证GPT后的撰写：你可以使用OpenCV中的 cv2.normalize() 函数来对结果进行归一化处理，例如： sobel1 = cv2.Sobel(img, cv2.CV_6
HTTP/1.1与HTTP/2有什么区别？
2019-10-16 13:46

鬼谷子24的博客但是在2015年，重新构想的版本称为HTTP/2投入使用，它提供了几种减少延迟的方法，尤其是在处理移动平台以及服务器密集型图形和视频时。此后HTTP/2变得越来越流行，据估计，世界上约有三分之一的网站都支持HTTP/2。在...
如何在上传图像时修复WordPress上的HTTP错误？ http php
2018-08-29 18:45

回答 1 已采纳 change it globaly in php.ini (in xampp located in '\xampp\php\php.ini'): memory_limit = 256M // s
我在裁剪图像时获取训练数据时，gpu环境出问题了 tensorflow
2023-04-10 08:48

回答 2 已采纳以下内容部分参考ChatGPT模型：这个问题可能是由于GPU资源不足导致的。您可以尝试减小batch size或者增加GPU的内存限制。另外，您可以尝试重新安装tensorflow或者升级到最新版
使用transform对tif图像进行转换，显示进程已结束，退出代码为 -1073740791 (0xC0000409) python pytorch 图像处理
2023-03-23 11:26

回答 2 已采纳问题找到了，是CPU原因，AMD 的 CPU不支持，只有Intel可以
从浏览器输入http://www.baidu.com，到看到百度主页的过程中到底发生了什么？
2021-03-27 15:49

韩哥有话说的博客从浏览器输入http://www.baidu.com，到看到百度主页的过程中到底发生了什么？网络模型 1. 根据网络七层模型，浏览器和服务器都可以认为是应用层的一个应用， 2. 所以本质上来说就是从一个应用层到另外一个应用层的...
Sobel算子使用中为什么可以直接处理灰度图像？ opencv
2022-03-12 18:30

回答 1 已采纳不是特别理解你说的，说下我的理解首先Sobel算子是用于边缘检测的算子，得出的结果并不是二值图，得到二值图像往往是设置了一个阈值，可以理解为当sobel算子结果超过该阈值时，给点为边缘点（为1），否则
我想问下在idea输出图片时为什么会是乱码。求解！ java
2022-03-03 16:48

回答 1 已采纳输出到控制台的是字符串，而图片数据是严格按照图片格式分布的二进制流，你直接把二进制流强行转换成字符串输出到控制台，当然是乱码。
从url中获取http.Get（）图像并写入GridFS http
2018-11-17 12:22

回答 1 已采纳 Have you tried io.Copy(gridFile, response.Body)? seems like an obvious short circuit
http 头信息详解
2024-05-05 05:12

2401_84407887的博客 Cookie：这是最重要的请求头信息之一，参见后面《Cookie处理》一章中的讨论。From：请求发送者的email地址，由一些特殊的Web客户程序使用，浏览器不会用到它。Host：初始URL中的主机和端口。If-Modified-Since：只有...
使用cropper进行图像裁剪时的问题 css html5 javascript
2023-03-29 13:25

回答 1 已采纳这个问题可能是由于CSS样式或JavaScript代码的问题导致的。确保CSS和JavaScript文件已正确加载。检查浏览器的开发者工具，查看是否存在404错误或其他加载问题。确保使用正确的CS
前端性能优化学习 05 请求和响应优化 01（DNS 解析、HTTP 长连接、HTTP2、避免重定向、压缩传输的数据资源）
2022-05-16 11:39

皮蛋很白的博客减少 DNS 查找：每次主机名的解析都需要一次网络往返，从而增加了请求的延迟时间，同时还会阻塞后续的请求。重用 TCP 连接：尽可能的使用持久连接，以消除因 TCP 握手和慢启动导致的延迟。减少 HTTP 重定向：HTTP ...
计算机网络整理：HTTP协议、HTTPS协议、Websocket协议
2021-08-26 18:42

yπ_π的博客一：http协议和https协议的区别 1、Https通信需要证书，而证书一般需要向认证机构（一般是ca）购买，因而需要一定费用 2、http是超文本传输协议，信息是明文传输，https则是具有安全性的ssl加密传输协议。因此，与...
没有解决我的问题, 去提问

悬赏问题

¥20 测距传感器数据手册i2c
¥15 RPA正常跑，cmd输入cookies跑不出来
¥15 求帮我调试一下freefem代码
¥15 matlab代码解决，怎么运行
¥15 R语言Rstudio突然无法启动
¥15 关于#matlab#的问题：提取2个图像的变量作为另外一个图像像元的移动量，计算新的位置创建新的图像并提取第二个图像的变量到新的图像
¥15 改算法，照着压缩包里边，参考其他代码封装的格式写到main函数里
¥15 用windows做服务的同志有吗
¥60 求一个简单的网页(标签-安全|关键词-上传)
¥35 lstm时间序列共享单车预测，loss值优化，参数优化算法

码龄粉丝数原力等级 --

尝试使用“ net / http”获取某些图像时，为什么会收到“ net / http：等待连接时请求已取消”的信息

1条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

尝试使用“ net / http”获取某些图像时，为什么会收到“ net / http：等待连接时请求已取消”的信息

1条回答 默认 最新

悬赏问题

1条回答默认最新