求各位帮我看看这个怎么改

import requests
from bs4 import BeautifulSoup
import csv
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
}
def get_html(url):
html = requests.get(url, headers=headers)
html.encoding = 'utf-8'
return html.text
def parse_html(html):
html_url = BeautifulSoup(html, 'lxml')
conMidtab1 = html_url.find('div', id="container")
lst = []
for conMidtab2 in conMidtab1:
dic = {}
a = conMidtab2.find('a', target="blank")
lj = a.get('href')
mz = a.get('alt')
dic['图片名'] = mz
dic['图片链接'] = lj
lst.append(dic)
return lst
def save_data(lst):
with open('tupian.csv', 'w', encoding='utf-8', newline='') as f:
writer = csv.DictWriter(f, fieldnames=['图片名', '图片链接'])
writer.writeheader()
writer.writerows(lst)
moxie_content = []
for i in range(1, 11):
if i == 1:
url = 'https://sc.chinaz.com/tupian/index.html'
else:
url = f'https://sc.chinaz.com/tupian/index{i}.html'
html = get_html(url)
moxie_content = moxie_content + parse_html(html)
save_data(moxie_content)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

天际的海浪 2022-05-31 01:40

关注

你题目的解答代码如下：

import requests
from bs4 import BeautifulSoup
import csv
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'
}
def get_html(url):
    html = requests.get(url, headers=headers)
    html.encoding = 'utf-8'
    return html.text
def parse_html(html):
    html_url = BeautifulSoup(html, 'lxml')
    conMidtab1 = html_url.select('#container>div>div>a[target="_blank"]')
    lst = []
    for a in conMidtab1:
        dic = {}
        lj = a.get('href')
        mz = a.get('alt')
        dic['图片名'] = mz
        dic['图片链接'] = "https:"+lj
        lst.append(dic)
        print(dic)
    return lst

def save_data(lst):
    with open('tupian.csv', 'w', encoding='utf-8', newline='') as f:
        writer = csv.DictWriter(f, fieldnames=['图片名', '图片链接'])
        writer.writeheader()
        writer.writerows(lst)

moxie_content = []
for i in range(1,11):
    if i == 1:
        url = 'https://sc.chinaz.com/tupian/index.html'
    else:
        url = f'https://sc.chinaz.com/tupian/index_{i}.html'
    html = get_html(url)
    moxie_content = moxie_content + parse_html(html)
save_data(moxie_content)

如有帮助，请点击我的回答下方的【采纳该答案】按钮帮忙采纳下，谢谢!

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

求各位帮我看看这个怎么改 python
2022-05-31 00:23

回答 1 已采纳你题目的解答代码如下： import requests from bs4 import BeautifulSoup import csv headers = { 'User-Agent': 'Mozi
各位帮我看看哪儿有问题 python
2022-10-12 17:54

回答 2 已采纳乘号呢 s=math.sqrt(d*(d-a)*(d-b)*(d-c)) 有帮助的话采纳一下哦！
各位看看这该怎么改啊 python
2022-08-26 18:47

回答 2 已采纳把第二行改为 month=int(input())
python怎么看模块方法_python看某个模块的版本方法
2021-01-14 03:55

温酒斩桦腾的博客 python看某个模块的版本方法例如networkx模块启动python命令行,输入以下两行命令import networkxnetworkx.__version__以上这篇python看某个模块的版本方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也...
请各位看一下我应该怎么改 python
2021-10-05 22:23

回答 1 已采纳字符串输入不需要eval,eval是你想将输入直接转化为int,float等时候才用到的
各位大佬，帮我看看我的代码应该怎么改才对哇？ python
2019-11-29 23:00

回答 3 已采纳这个你要把完整的文本文件发出来才知道，看不出你的空格有几个，换行符用的什么，所以怎么知道seek什么地方呢
求各位大神看一下哪里错了，怎么改。 python tensorflow 神经网络
2018-11-01 09:57

回答 1 已采纳 https://blog.csdn.net/jacke121/article/details/76980351
100天精通Python丨基础知识篇 —— 07、10个Python高级库总结
2021-07-08 19:58

不吃西红柿丶的博客《C站最全Python标准库总结》，登顶了【全站综合热榜】和【python领域热榜】，获得了2362多次点赞、998次评论、2072次收藏，谢谢各位小伙伴。
我想改文件的名字，但是没成功，请各位看看我写的代码到底哪里有问题 python
2021-06-29 15:50

回答 4 已采纳 import os path = "" #文件夹路径 files = os.listdir(path) path1 = path + "/" for file in files: old
Python中for循环求200-300之间的素数 python
2022-11-15 20:35

回答 1 已采纳 for n in range(200,301): #范围200~300之间 flag = True # 假设是素数 for i in range(2,n-1): i
请各位看看哪里出错了！ python
2022-08-22 15:36

回答 2 已采纳看看json文件格式json文件参考格式https://blog.csdn.net/weixin_48185778/article/details/109822965?ops_request_misc
我用python自制hosts修改神器，组长说你他娘的还真是个天才（附源码）
2021-08-21 12:40

一条coding的博客（一条工作中主要就是这种情况）针对以上痛点，一条自制了一款修改神器，2秒内切换/修改完hosts，可不要小看这两秒，效率是第一生产力，另外这可是个装x神器。文末有C站内测投票可体验效果展示目前主要实现了三...
python修改字体无效_python修改字体的方法
2021-03-17 22:27

weixin_39732716的博客 python修改字体的方法发布时间：2020-09-23 09:55:51来源：亿速云阅读：95作者：小新这篇文章主要介绍python修改字体的方法，文中介绍的非常详细，具有一定的参考价值，感兴趣的小伙伴们一定要看完！# 1、先导入分别...
python计算整数各位数字之和_编写函数,计算一个整数各位数字之和
2021-02-04 13:05

Suez.张的博客话题：编写函数,计算一个整数各位数字之和回答：这个关键是怎么得到每位数， #includeint sum_num(int num)//得到每位数的函数 { int sum=0; while(num10) //计算每位数的循环，先得到的是各位然后依次类推 { sum+=...
python求n项和_python 输入一个数n,求n个数求乘或求和的实例
2020-12-20 14:39

weixin_39621060的博客 python 输入一个数n,求n个数求乘或求和的实例求和try:while True:n=input()s=1for x in raw_input().split():s=s+int(x)print sexcept EOFError:exit()求乘try:while True:n=input()s=1for x in raw_input().split()...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月31日

悬赏问题

¥15 Python中的request，如何使用ssr节点，通过代理requests网页。本人在泰国，需要用大陆ip才能玩网页游戏，合法合规。
¥100 为什么这个恒流源电路不能恒流？
¥15 有偿求跨组件数据流路径图
¥15 写一个方法checkPerson，入参实体类Person，出参布尔值
¥15 我想咨询一下路面纹理三维点云数据处理的一些问题，上传的坐标文件里是怎么对无序点进行编号的，以及xy坐标在处理的时候是进行整体模型分片处理的吗
¥15 CSAPPattacklab
¥15 一直显示正在等待HID—ISP
¥15 Python turtle 画图
¥15 stm32开发clion时遇到的编译问题
¥15 lna设计源简并电感型共源放大器

求各位帮我看看这个怎么改

1条回答 默认 最新

问题事件

悬赏问题

1条回答默认最新