兄弟们帮帮忙期末作业？？

小白啥也不会，用爬虫软件的

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

CSDN专家-深度学习进阶 2021-06-10 10:47

关注

这是我之前做爬取京东商品评论的代码，可以参考下，自己改下路径就行了

# coding=utf-8
import requests
import re
import io
import sys
reload(sys)
sys.setdefaultencoding('utf8')

temp='https://item.jd.com/100004325476.html'
headers = {
        'User-Agent': 'Mozilla / 5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 89.0.4389.90Safari / 537.36'
    # 请求的客户端信息
    }

def url(temp):
    jd_id=re.findall("\d+",temp)[0]  # 提取商品id
    # 替换京东商品js中一般的Request URL模板
    l='https://club.jd.com/comment/productPageComments.action?productId=xxx&score=0&sortType=5&page={page_num}&pageSize=10&isShadowSku=1&rid=0&fold=1'
    l=l.replace('xxx', jd_id)  # 替换id
    return l

def init():
        # 实例化类的时候运行初始化函数
        # 打开文件
        file_name = 'jd_commet'
        print '正在打开文件'+file_name+'txt文件!'

def parse_one_page(url,fp):
        # 指定url
        # url='https://club.jd.com/comment/productPageComments.action?productId=100017543968&score=0&sortType=6&page=1&pageSize=10&isShadowSku=100016034372&rid=0&fold=1'
        # 发起请求
        response = requests.get(url, headers=headers)
        # 获取响应
        js_data = response.json()
        # 提取评论列表
        comments_list = js_data['comments']

        for comment in comments_list:
            # 评论内容
            content = comment.get('content')
            content = ' '.join(content.split('\n'))  # 处理换行符
            print(content)
            # 循环写出数据
            fp.write(u'{}\n'.format(content))
            fp.write(u"\n")  # 写入一条数据后加一行空数据

def parse_max_page(l):
        fp = io.open('E:/python/jd_commet.txt', 'w', encoding='utf_8_sig')
        for page_num in range(10):  # 抓包获得最大页数  最大50页，超出自动停止
            # 指定通用的url模板
            new_url=l.format(page_num=page_num) # 把字符串替换为变量
            print '正在获取第'+str(page_num)+'页'
            # 调用函数
            parse_one_page(url=new_url, fp=fp)
        fp.close()

def close_files():
        print('爬虫结束，关闭文件！')

def run(temp):
    init()
    l = url(temp)
    # 开始爬虫
    parse_max_page(l=l)
    # 关闭文件
    close_files()
if __name__ == '__main__':
    run(temp)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(3条)

报告相同问题？

关注问题

兄弟们帮帮忙期末作业？？ python 有问必答
2021-06-10 10:43

回答 4 已采纳这是我之前做爬取京东商品评论的代码，可以参考下，自己改下路径就行了 # coding=utf-8 import requests import re import io import sys re
C语言程序设计拜托大佬帮帮忙期末考试 c语言
2020-06-06 15:48

回答 2 已采纳大致的思路是： int 体重; int 身高; int 引体向上; int 肺活量; int 仰卧起坐; int 性别; printf("性别1男2女"); scanf("%d", &
Web期末作业，望大佬救命！！！？ eclipse java
2020-12-02 10:51

回答 8 已采纳 NICK
python下tkinter模块和mysql构建图书管理系统实验
2022-02-13 18:37

xwss的博客本次实验是大二数据库期末大作业，我采用的是python语言和mysql8.0.27制作的基于cs构架的数据库框架，由于之前从未了解过python语言，所以代码部分语言较为粗暴，未成年人请在父母陪同下观看（狗头），至于mysql的...
python期末考试sos python 有问必答
2021-12-17 14:00

回答 1 已采纳你题目的解答代码如下： class Person: def __init__(self,name,age,sex): self.name = name self
Python期末考试sos python
2021-12-17 14:40

回答 1 已采纳 class Person(object): def __init__(self): self._name: str = '' self._age: int =
要Python期末考试了 python
2021-12-25 08:22

回答 1 已采纳 pow()结果是浮点数，浮点数相乘后有精度损失的所以结果 pow（3,0.5）*pow（3,0.5）==3 是错的选 C
杂谈 | 国内这么多码农，为什么出不来JetBrains, MathWorks这样的公司？
2024-01-08 12:55

幻境逐梦的博客 ”，你们不要因为我比你们年龄大一些就不敢说话，就不能畅所欲言，你就当我是你们的兄弟，咱兄弟之间唠家常，有啥说啥。当然，在这篇文章中，孔子对子路的评价我是不敢苟同的，这个世界需要谦虚的人，也需要张扬的人...
期末考试填空题目，帮我看看哈 python
2021-06-09 17:06

回答 1 已采纳 ID=input() s=eval(ID) if s%2==0: print('') else: print('') ----------------- def fib(n):
期末考填空题目，拜托帮我解答一下 python
2021-06-09 19:54

回答 1 已采纳 def s fact(n) if uamt[:-1] else listplay continue x[1]
Python期末考试，40分钟就交了 python
2022-05-30 18:37

回答 1 已采纳【有帮助请采纳】 def isleap(startyear,endyear): day = 0 for i in range(startyear,endyear+1):
知乎：在卡内基梅隆大学 (Carnegie Mellon University) 就读是怎样一番体验？
2019-08-14 07:19

weixin_30381317的博客做 TA是我这一年里很美好的回忆，虽然当自己的作业已经焦头烂额的时候还要帮别人有时候很崩溃，虽然有时候涌现在脑海里的解释不知道如何用英语准确的表达出来，虽然TA花的时间多赚的钱少的可怜，但是当收到那些...
python入门期末考试题型，这个怎么算的 python
2021-09-27 19:09

回答 1 已采纳 # 定义一个字典d d={"A":10, "B":2, "C":100, "D":9, "E":-10} # 定义变量s 并赋值为0 s=0 # 遍历字典d所有的键:['A', 'C', 'B', '
23 岁那年你正处在哪个状态？现在呢？
2014-03-21 20:58

蓝色的杯子的博客感觉23岁就一整年都在忙，因为增加了新的业务块，上海、北京的培训、学习、拉关系。24岁生日后，老板把我加进M序列（之前是T序列），然后现在24岁半了，唯一的感觉是时间过的很快，时间就在自己每天设定的计划驱使下...
作为硕士生/博士生导师招收的第一个学生是一种怎样的体验？| 文末送书
2020-07-15 21:55

woshicver的博客老师总是鼓励我、开导我、帮助我，用他亲身的读博经历传授给我一些经验，而且他一有机会就帮我引荐他的同济大学的师兄弟圈子，让我在学术上开阔了很多视野。去年8月，还没开学的时候就替他参加了一次学术会议，全...
没有解决我的问题, 去提问

悬赏问题

¥15 PSCAD安装问题 ERROR: Visual Studio 2013, 2015, 2017 or 2019 is not found in the system.
¥15 (标签-MATLAB|关键词-多址)
¥15 关于#MATLAB#的问题，如何解决？（相关搜索：信噪比，系统容量）
¥500 52810做蓝牙接受端
¥15 基于PLC的三轴机械手程序
¥15 多址通信方式的抗噪声性能和系统容量对比
¥15 winform的chart曲线生成时有凸起
¥15 msix packaging tool打包问题
¥15 finalshell节点的搭建代码和那个端口代码教程
¥15 Centos / PETSc / PETGEM

码龄粉丝数原力等级 --

兄弟们帮帮忙期末作业？？

4条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

兄弟们帮帮忙期末作业？？

4条回答 默认 最新

悬赏问题

4条回答默认最新