怎么用python查找网站后台地址?
我用的是python3.x
1条回答 默认 最新
- Jettblue_jr 2022-12-17 16:41关注
import re import time import requests class GetLinksTitles(): def links_titles(self): links_titles = [] for i in range(211150, 211185): url = "https://support.apple.com/zh-cn/HT" + str(i) r = requests.get(url=url) if r.status_code == 200: html = r.content.decode('utf-8') pattern = r'<title lang="zh-CN">(.*?) - Apple 支持</title>' title = re.findall(pattern, html) links_titles.append(url) links_titles.append(title) print("地址:%s 标题:%s"%(url, title)) else: print("不存在:%d"%(i)) return links_titles def save_links_titles(self, links_titles): file = open('GetLinksTitles' + time.strftime('%Y%m%d%H%M%S') + '.txt', 'w') for i in range(len(links_titles)): text = str(links_titles[i]).replace("['", "").replace("']", "") + '\n' file.write(text) if __name__ == '__main__': links_titles = GetLinksTitles().links_titles() GetLinksTitles().save_links_titles(links_titles)
望采纳
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 关于#java#的问题:找一份能快速看完mooc视频的代码
- ¥15 这种微信登录授权 谁可以做啊
- ¥15 请问我该如何添加自己的数据去运行蚁群算法代码
- ¥20 用HslCommunication 连接欧姆龙 plc有时会连接失败。报异常为“未知错误”
- ¥15 网络设备配置与管理这个该怎么弄
- ¥20 机器学习能否像多层线性模型一样处理嵌套数据
- ¥20 西门子S7-Graph,S7-300,梯形图
- ¥50 用易语言http 访问不了网页
- ¥50 safari浏览器fetch提交数据后数据丢失问题
- ¥15 matlab不知道怎么改,求解答!!