python代码提问

各位大佬有没有人能帮帮忙写一个python爬虫的代码，不用很多，八十行左右就行。没有很高的要求，只要爬的网站不是很偏门就行。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

5条回答默认最新

CSDN专家-深度学习进阶 2021-06-02 19:16

关注

这是我之前爬取京东评论写的，你可以看一下

# coding=utf-8
import requests
import re
import io
import sys
reload(sys)
sys.setdefaultencoding('utf8')
temp='https://item.jd.com/100004325476.html'
headers = {
        'User-Agent': 'Mozilla / 5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 89.0.4389.90Safari / 537.36'
    # 请求的客户端信息
    }
def url(temp):
    jd_id=re.findall("\d+",temp)[0]  # 提取商品id
    # 替换京东商品js中一般的Request URL模板
    l='https://club.jd.com/comment/productPageComments.action?productId=xxx&score=0&sortType=5&page={page_num}&pageSize=10&isShadowSku=1&rid=0&fold=1'
    l=l.replace('xxx', jd_id)  # 替换id
    return l
def init():
        # 实例化类的时候运行初始化函数
        # 打开文件
        file_name = 'jd_commet'
        print '正在打开文件'+file_name+'txt文件!'
def parse_one_page(url,fp):
        # 指定url
        # url='https://club.jd.com/comment/productPageComments.action?productId=100017543968&score=0&sortType=6&page=1&pageSize=10&isShadowSku=100016034372&rid=0&fold=1'
        # 发起请求
        response = requests.get(url, headers=headers)
        # 获取响应
        js_data = response.json()
        # 提取评论列表
        comments_list = js_data['comments']
        for comment in comments_list:
            # 评论内容
            content = comment.get('content')
            content = ' '.join(content.split('\n'))  # 处理换行符
            print(content)
            # 循环写出数据
            fp.write(u'{}\n'.format(content))
            fp.write(u"\n")  # 写入一条数据后加一行空数据
def parse_max_page(l):
        fp = io.open('E:/python/jd_commet.txt', 'w', encoding='utf_8_sig')
        for page_num in range(10):  # 抓包获得最大页数  最大50页，超出自动停止
            # 指定通用的url模板
            new_url=l.format(page_num=page_num) # 把字符串替换为变量
            print '正在获取第'+str(page_num)+'页'
            # 调用函数
            parse_one_page(url=new_url, fp=fp)
        fp.close()
def close_files():
        print('爬虫结束，关闭文件！')
def run(temp):
    init()
    l = url(temp)
    # 开始爬虫
    parse_max_page(l=l)
    # 关闭文件
    close_files()
if __name__ == '__main__':
    run(temp)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(4条)

报告相同问题？

关注问题

python代码提问 python 有问必答
2021-06-02 17:18

回答 5 已采纳这是我之前爬取京东评论写的，你可以看一下 # coding=utf-8 import requests import re import io import sys reload(sys) sys
Python代码提问 python
2021-12-25 22:01

回答 3 已采纳 i = 1 a = str(input("请输入密码：")) while i < 3: if a == '123': print("密码正确") i
python tkinter代码提问 python
2022-06-02 19:23

回答 3 已采纳你字符串中是什么内容?字符串是是不是有数字之外字符,所以不能转为浮点数
python代码代写_python代写代码
2020-11-20 23:44

weixin_39612220的博客 1 原则在开始讨论python社区所采用的具体标准或是由其他人推荐的建议之前，考虑一些总体原则非常重要。请记住可读性标准的目标是提升可读性。这些规则存在的目的就是为了帮助人读写代码，而不是相反。本小节讨论...
大学python编程提问 python
2023-04-08 16:30

回答 4 已采纳可以参考下面代码 def get_sum(number): result = 0 data_list = [] for i in range(0, number):
来自python的提问 python
2023-02-13 19:55

回答 3 已采纳你的b是 a整除100得到的商，他肯定是两位数啊，比如1000 整除 100结果是 10。
用vscode无法运行python代码。 python vscode
2022-08-17 12:46

回答 6 已采纳直接在终端输入：C:/Users/huang'ruo/AppData/Local/Programs/Python/Python38/python.exe试试
个人整理Python代码实例
2022-05-19 23:34

量慧实工作室LHStudio的博客个人整理Python代码实例 1。四位数字字母验证码的生成实例 1 import random 2 if __name__ =="__main__": #四位数字字母验证码的生成 3 checkcode="" #保存验证码的变量 4 for i in range(4): 5 index=...
python 循环回答提问 python
2022-07-17 21:43

回答 1 已采纳 print('请问花中四君子是什么花？') flower = ['梅花','兰花','竹子','菊花'] answer = [] while flower: t = input() i
我对Python的提问！ python
2022-11-10 10:57

回答 1 已采纳因为弄错了呗你不告诉我你到底干了啥，我怎么知道你哪里弄错了
Python面向对象编程提问 python
2022-09-12 10:41

回答 2 已采纳 a_game中的一个变量是一个实例，而它本身也是一个实例
python如何实现提问并回答_Python编程提问
2020-12-04 13:30

weixin_39577422的博客问题一：def moon_weight(e_weight,up_weight):for eachyear in range(15):m_weight = e_weight * 0.165print(m_weight , end = " ")e_weight = e_weight + up_weight问题二：def moon_weight(e_weight,up_weight,...
通过python代码向chatGPT提问，并接受返回结果打印
2023-03-26 19:11

东方-教育技术博主（接私活）的博客由于科研需求过程结果步骤： 1 申请API https://platform.openai.com/docs/api-reference/introduction 2 得到一个密钥 3 放到上面的python 代码 # -*- coding:utf-8 -*-f import requests import openai openai....
python简单病毒代码
2023-05-28 15:33

sm!ley的博客首先，整个代码不会有太多伤害其次，蓝屏不是真蓝屏如果喜欢的话，点个关注吧！谢！谢！上代码： #导入所需软件 import io import random import locale from tkinter import * from os import system import ...
PYTHON学习教程，如何深入了解Python，提高编写代码的能力.pdf
2023-05-06 15:55

阅读Python官方文档是提高编写Python代码能力的最佳方法。文档详细介绍了Python语言的各个方面，包括语法、内置函数、标准库和第三方库等。此外，文档还提供了许多示例代码，可以帮助您更好地理解Python的使用方法。...
没有解决我的问题, 去提问

悬赏问题

¥20 有偿写代码要用特定的软件anaconda 里的jvpyter 用python3写
¥20 cad图纸，chx-3六轴码垛机器人
¥15 移动摄像头专网需要解vlan
¥20 access多表提取相同字段数据并合并
¥20 基于MSP430f5529的MPU6050驱动，求出欧拉角
¥20 Java-Oj-桌布的计算
¥15 powerbuilder中的datawindow数据整合到新的DataWindow
¥20 有人知道这种图怎么画吗？
¥15 pyqt6如何引用qrc文件加载里面的的资源
¥15 安卓JNI项目使用lua上的问题

码龄粉丝数原力等级 --

python代码提问

5条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

python代码提问

5条回答 默认 最新

悬赏问题

5条回答默认最新