东燕西飞 2023-04-22 11:46 采纳率: 88.2%
浏览 20
已结题

请教一个问题关于PHP的CURL的问题

之前遇到一个CURL问题,抓取异常的慢,某度下找到了结果,由于不固定抓取各种网页,我想问下这样设置有什么局限或者缺点吗?

以下是找到的解决办法:

如果你用 curl_setopt 函数来与远程的webservice或者抓取页面的处理时,有时会遇到很奇怪的现象,首次访问的速度异常的慢,基本上要5s-10s的时间让人奔溃。

但是怎么查也差不出问题出在哪儿,最近发现一个文章写了处理这个问题的方式。

先从解决问题入手:

1、curl_setopt($ch, CURLOPT_HTTP_VERSION, CURL_HTTP_VERSION_1_0); //强制协议为1.0

2、curl_setopt($ch, CURLOPT_HTTPHEADER, array(''Expect: '')); //头部要送出'Expect: '

3、curl_setopt($ch, CURLOPT_IPRESOLVE, CURL_IPRESOLVE_V4 ); //强制使用IPV4协议解析域名

  • 写回答

3条回答 默认 最新

  • CSDN专家-sinJack 2023-04-22 11:54
    关注

    是仅仅适用于特定的情况,比如访问的远程服务器只支持HTTP/1.0协议、需要发送Expect头部、或者需要强制使用IPv4协议解析域名。如果遇到其他情况,这些设置可能会导致访问失败或者出现其他问题。因此,在使用这些设置时,需要根据具体情况进行评估和测试,以确保其适用性和稳定性。同时,这些设置可能也会影响到访问速度和性能。


    可以尝试以下几种方法来解决:
    1. 设置超时时间:在curl_setopt()函数中设置CURLOPT_TIMEOUT和CURLOPT_CONNECTTIMEOUT选项,分别表示请求超时和连接超时时间,可以根据需要适当调整。

    2. 使用HTTP/2协议:如果您的服务器和目标网站都支持HTTP/2协议,可以尝试使用HTTP/2协议来提高抓取速度。

    3. 使用多线程:可以使用多线程来同时抓取多个网页,从而提高效率。

    4. 优化代码:检查代码中是否存在不必要的循环或递归等操作,优化代码可以提高抓取速度。

    5. 使用缓存:可以将抓取结果缓存起来,下次请求时直接从缓存中获取,避免重复抓取。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 5月28日
  • 已采纳回答 5月20日
  • 创建了问题 4月22日

悬赏问题

  • ¥15 如何用Labview在myRIO上做LCD显示?(语言-开发语言)
  • ¥15 Vue3地图和异步函数使用
  • ¥15 C++ yoloV5改写遇到的问题
  • ¥20 win11修改中文用户名路径
  • ¥15 win2012磁盘空间不足,c盘正常,d盘无法写入
  • ¥15 用土力学知识进行土坡稳定性分析与挡土墙设计
  • ¥70 PlayWright在Java上连接CDP关联本地Chrome启动失败,貌似是Windows端口转发问题
  • ¥15 帮我写一个c++工程
  • ¥30 Eclipse官网打不开,官网首页进不去,显示无法访问此页面,求解决方法
  • ¥15 关于smbclient 库的使用