I need a script that can spider a website and return the list of all crawled pages in plain-text or similar format; which I will submit to search engines as sitemap. Can I use WGET to generate a sitemap of a website? Or is there a PHP script that can do the same?
关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率

已采纳
我可以使用WGET生成网站的站点地图吗?
收起
- 写回答
- 好问题 0 提建议
- 关注问题
微信扫一扫
点击复制链接分享
- 邀请回答
- 编辑 收藏 删除 结题
- 收藏 举报
2条回答 默认 最新
- 关注
码龄 粉丝数 原力等级 --
- 被采纳
- 被点赞
- 采纳率
douyun3631 2011-07-19 05:15关注wget --spider --recursive --no-verbose --output-file=wgetlog.txt http://somewebsite.com sed -n "s@.\+ URL:\([^ ]\+\) .\+@\1@p" wgetlog.txt | sed "s@&@\&@" > sedlog.txt
This creates a file called
sedlog.txt
that contains all links found on the specified website. You can use PHP or a shell script to convert the text file sitemap into an XML sitemap. Tweak the parameters of the wget command (accept/reject/include/exclude) to get only the links you need.本回答被题主选为最佳回答 , 对您是否有帮助呢? 本回答被专家选为最佳回答 , 对您是否有帮助呢? 本回答被题主和专家选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏举报微信扫一扫
点击复制链接分享
编辑预览轻敲空格完成输入- 显示为
- 卡片
- 标题
- 链接
评论按下Enter换行,Ctrl+Enter发表内容
编辑
预览

轻敲空格完成输入
- 显示为
- 卡片
- 标题
- 链接
报告相同问题?
提交
- 2016-04-05 12:38回答 1 已采纳 The best command is php /home/account/invest/controllers/cron_controller.php.
- 2018-11-21 06:23回答 1 已采纳 Thanks to Mike Q I figure out why wget was not working. It turn out it was a permission issue. I j
- 2013-05-10 21:48回答 1 已采纳 You can easily count web pages if website is static or small. but if website is too big like Stac
- 2021-03-17 13:21车干水寿的博客 前言:站点地图(sitemap.xml)的作用,相信站长们都有所了解,我就不献宝了。而免插件生成sitemap.xml,网络上也早就有了纯代码生成的方法。一直以来,张戈博客都是用DX-SEO这个很好用的中文SEO插件生成的sitemap。...
- 2022-11-25 04:30回答 2 已采纳 你遇到的403 Forbidden错误的可能原因: 1、你的IP被列入黑名单。 2、你在一定时间内过多地访问此网站(一般是用采集程序),被防火墙拒绝访问了。 3、连接的用户过多,可以过后再
- 2017-04-18 04:27回答 1 已采纳 wget is a web client, it's really meant for HTTP requests. But this isn't an HTTP location, it's
- 2016-06-06 04:52回答 1 已采纳 The primary difference is the security access of the user account calling the script. For examples
- 2021-03-22 02:13weixin_39664477的博客 前言:站点地图(sitemap.xml)的作用,相信站长们都有所了解,我就不献宝了。而免插件生成sitemap.xml,网络上也早就有了纯代码生成的方法。一直以来,都是用DX-SEO这个很好用的中文SEO插件生成的sitemap。今天整理...
- 2014-10-08 12:35回答 2 已采纳 Thanks for the help everyone. I was actually able to figure this out - it is possible via CURL. I
- 2013-02-17 08:57回答 3 已采纳 You mention two path to search.php : one is with /test, the other is with /ting. Make sure you are
- 2014-08-21 02:06回答 4 已采纳 I get contents of file this way: <?php $postdata = file_get_contents("php://input"); ?> $
- 2021-05-07 21:17weixin_39832628的博客 前言:站点地图(sitemap.xml)的作用,相信站长们都有所了解,我就不献宝了。而免插件生成sitemap.xml,网络上也早就有了纯代码生成的方法。一直以来,张戈博客都是用DX-SEO这个很好用的中文SEO插件生成的sitemap。...
- 2021-04-26 17:15寒夜剑鸣的博客 一直以来,张戈博客都是用DX-SEO这个很好用的中文SEO插件生成的sitemap。...感觉有点缺憾,反正今天也是闲着,就动手改造了一番,让这个代码更加完善,可以同时生成首页、文章、单页面、分类和标签...
- 2023-06-14 01:15爱学习的阿松的博客 但是wordpress自带的站点地图属于索引型,可以简单的理解为xml文档里面还有xml文档,而不是真正的网站网址,这种索引型通过sitemap提交的话百度不会收录,会提示“索引型不予处理”,所以本章教大家如何不使用插件的...
- 2019-06-18 01:53可以从ImageMagick的官方网站或镜像站点下载最新版本的源码包。这里以ImageMagick-7.0.7-25为例: ```bash wget https://netix.dl.sourceforge.net/project/imagemagick/im7-src/ImageMagick-7.0.7-25.tar.gz `...
- 2021-04-03 00:10weixin_39542710的博客 我要明确的回答使用php生成网站缩略图是不可能完成的任务。那为什么我标题还要用“php生成网站缩略图”,那是因为我们可以用php作为接口,通过页面传入参数来调用后台生成网页的缩略图。由于太费资源这个功能已经...
- 2020-12-18 07:14在Linux环境中,使用PHP生成网站截图可以通过一个名为`wkhtmltopdf`的开源工具来实现。`wkhtmltopdf`是基于QtWebKit引擎的,它能够将HTML网页转换为PDF或者图片格式,包括PNG、JPEG等。这个工具利用了WebKit渲染引擎...
- 2021-06-13 22:56许桐楷的博客 长期以来明月都是借助插件来生成站点地图(sitemap.xml)的,但是这类插件往往刚开始的时候都是“中规中矩”的,在有了一定的安装量后就会有各种捆绑的“推广”、“营销”类的动作让人是烦不胜烦呀,最近在部署 SSL 后...
- 没有解决我的问题, 去提问
联系我们(工作时间:8:30-22:00)
400-660-0108kefu@csdn.net在线客服
- 京ICP备19004658号
- 经营性网站备案信息
公安备案号11010502030143
- 营业执照
- 北京互联网违法和不良信息举报中心
- 家长监护
- 中国互联网举报中心
- 网络110报警服务
- Chrome商店下载
- 账号管理规范
- 版权与免责声明
- 版权申诉
- 出版物许可证
- ©1999-2025北京创新乐知网络技术有限公司