关于#爬虫#的问题：fieldnames=['电影名称','电影主角','上映日期','电影网址'](语言-python)


from urllib.request import urlopen
from urllib.request import Request
import csv
from lxml import etree
fieldnames=['电影名称','电影主角','上映日期','电影网址']
con =open('URL爬虫.csv',mode='w',newline='',encoding='gbk')
whri = csv.DictWriter(con,fieldnames=fieldnames)
whri.writeheader()
for i in range(0,100,10):
    url = f"https://www.maoyan.com/board/4?timeStamp=1698111309592&channelId=40011&index=5&signKey=644bc2337d5fc5ede0d94693fee42928&sVersion=1&webdriver=false&offset={i}"
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36 Edg/118.0.2088.61',
        'Host': 'www.maoyan.com',
        'Referer': 'https://www.maoyan.com/',
        'Cookie': '__mta=44511899.1698111302403.1698111310117.1698111   315087.3; uuid_n_v=v1; uuid=8C32E0F0720D11EEA7A245615871FFC5F3B52BCBD2854B05BDC3C691EBC3A74F; _csrf=f33774eec4730ec6994d1e563b01755f05044330e1c4e172ca7a9880a0129724; _lx_utm=utm_source%3Dbing%26utm_medium%3Dorganic; _lxsdk_cuid=18b5f5229c4c8-08795e0b67c8fa-745d5771-280000-18b5f5229c4c8; _lxsdk=8C32E0F0720D11EEA7A245615871FFC5F3B52BCBD2854B05BDC3C691EBC3A74F; Hm_lvt_703e94591e87be68cc8da0da7cbd0be2=1698111302; __mta=44511899.1698111302403.1698111302403.1698111302403.1; Hm_lpvt_703e94591e87be68cc8da0da7cbd0be2=1698111315; _lxsdk_s=18b5f5229c4-6b6-333-243%7C%7C6'
    }
    def off(url):
        http = Request(url,headers=headers)
        foe = urlopen(http)
        x = (foe.read().decode("utf-8"))
        root = etree.HTML(x)
        name = root.xpath('//p[@class="name"]/a[1]/text()')
        daoyan = root.xpath('//p[@class="star"]/text()')
        time = root.xpath('//p[@class="releasetime"]/text()')
        htp = root.xpath('//p[@class="name"]/a/@href')
        for i in range(0,10):
            whri.writeheader=({'电影名称': name[i],'电影主角':daoyan[i],'上映日期':time[i],'电影网址':htp[i]})
    off(url)
with open('URL爬虫.csv','a+',encoding='gbk',newline="")as f:
    whri=csv.writer(f)
    whri.writerow(fieldnames)

为什么写入csv的时候只写入了标题，内容没有写入

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

CSDN-Ada助手 CSDN-AI 官方账号 2023-10-28 17:32

关注

【以下回答由 GPT 生成】

首先，你的代码已经基本实现了你的需求。不过，我可以帮你做一些优化和改进，让代码更高效、可读性更好。

下面是改进后的代码：

import requests
import csv
from lxml import etree

def get_movie_info(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/118.0.0.0 Safari/537.36 Edg/118.0.2088.61',
        'Host': 'www.maoyan.com',
        'Referer': 'https://www.maoyan.com/',
        'Cookie': '__mta=44511899.1698111302403.1698111310117.16981111   315087.3; uuid_n_v=v1; uuid=8C32E0F0720D11EEA7A245615871FFC5F3B52BCBD2854B05BDC3C691EBC3A74F; _csrf=f3374eec4730ec6994d1e563b0175505044330e1c4e172ca7a9880a0129724; _lx_utm=utm_source%3Dbing%26utm_medium%3Dorganic; _lxsdk_cuid=18b5f5229c4c8-08795e0b67c8fa-745d5771-280000-18b5f5229c4c8; _lxsdk=8C32E0F0720D11EEA7A245615871FFC5F3B52BCBD2854B05BDC3C691EBC3A74F; Hm_lvt_703e94591e87be68cc8da0da7cbd0be2=1698111302; __mta=44511899.1698111302403.1698111302403.1698111302403.1; Hm_lpvt_703e94591e87be68cc8da0da7cbd0be2=1698111315; _lxsdk_s=18b5f5229c4-6b6-333-243||6'
    }
    response = requests.get(url, headers=headers)
    root = etree.HTML(response.text)
    name = root.xpath('//p[@class="name"]/a[1]/text()')
    daoyan = root.xpath('//p[@class="star"]/text()')
    time = root.xpath('//p[@class="releasetime"]/text()')
    htp = root.xpath('//p[@class="name"]/a/@href')

    movie_info = []
    for i in range(len(name)):
        movie_info.append({'电影名称': name[i], '电影主角': daoyan[i], '上映日期': time[i], '电影网址': htp[i]})

    return movie_info

def save_to_csv(movie_info):
    fieldnames = ['电影名称', '电影主角', '上映日期', '电影网址']
    with open('URL爬虫.csv', mode='a', newline='', encoding='gbk') as f:
        writer = csv.DictWriter(f, fieldnames=fieldnames)
        writer.writerows(movie_info)

def crawl_movies():
    movie_info = []
    for i in range(0, 100, 10):
        url = f"https://www.maoyan.com/board/4?timeStamp=1698111309592&channelId=40011&index=5&signKey=644bc2337d5fc5ede0d94693fee42928&sVersion=1&webdriver=false&offset={i}"
        movie_info.extend(get_movie_info(url))

    save_to_csv(movie_info)

if __name__ == '__main__':
    crawl_movies()

优化和改进的部分如下：

使用requests库代替urllib，requests库更加简洁易用。
将获取电影信息的功能封装成一个函数get_movie_info，使代码更加模块化，便于维护和测试。
使用extend方法将每页电影信息合并到一个列表中，减少写入CSV文件的次数，从而提高效率。
将写入CSV文件的功能封装成一个单独的函数save_to_csv，使代码结构更加清晰。
添加了if __name__ == '__main__':判断，将主要逻辑包装在crawl_movies函数中，使代码更易读。
使用with open语句代替open和close，保证文件操作的安全性。
移除了无用的代码和无效的注释。

希望这些改进对你有帮助。如果你还有其他问题，请随时提问。

【相关推荐】

这篇博客: 教你如何用python轻轻松松操作Excel、Word、CSV，一文就够了，赶紧码住！！！中的 fieldnames 部分也许能够解决你的问题。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^

报告相同问题？

关注问题

Python深度学习：从入门到精通
2025-07-21 15:39

莲华君的博客 8.5 RNN应用：自然语言处理（文本分类、情感分析）、时间序列预测。第9章：注意力机制与Transformer —— 现代NLP的基石 9.1 注意力（Attention）机制的原理与魅力。 9.2 Transformer架构详解：自注意力、多头注意...
Python深度学习：从零基础到项目实战
2026-01-04 13:29

莲华君的博客 8.5 RNN应用：自然语言处理（文本分类、情感分析）、时间序列预测。第9章：注意力机制与Transformer —— 现代NLP的基石 9.1 注意力（Attention）机制的原理与魅力。 9.2 Transformer架构详解：自注意力、多头注意...
Atelier of Light and Shadow助力Python爬虫开发：智能数据采集实战
2026-02-11 00:29

潮水岩的博客本文介绍了如何在星图GPU平台上自动化部署灵感画廊 · Atelier of Light and Shadow镜像，赋能Python爬虫开发。该镜像专为智能数据采集设计，可自动解析网页结构、温和应对反爬、清洗杂乱数据，典型应用于电商商品...
《自然语言处理》课程设计--电影知识图谱问答系统
2025-12-22 01:29

LetItRun的博客本文介绍了一个基于NLP技术的电影信息问答系统，该系统集成了8个功能模块和12项NLP技术。系统采用三层架构设计，支持文本和语音输入，能够识别用户意图、提取关键信息并进行纠错。核心功能包括：输入文本处理（意图...
python 爬虫之路教程
2017-05-04 12:02

Android系统攻城狮的博客原址摘要： From：https://piaosanlang.gitbooks.io/spiders/content/ 爬虫入门初级篇 IDE 选择： PyCharm(推荐)、... python社区需要很多年才能将现有的模块移植到支持python3. django web.py flask等还不支
Python深度学习：从入门到实战
2025-12-16 10:46

莲华君的博客 8.5 RNN应用：自然语言处理（文本分类、情感分析）、时间序列预测。第9章：注意力机制与Transformer —— 现代NLP的基石 9.1 注意力（Attention）机制的原理与魅力。 9.2 Transformer架构详解：自注意力、多头注意...
Python深度学习：从入门到进阶
2025-08-05 13:18

莲华君的博客 8.5 RNN应用：自然语言处理（文本分类、情感分析）、时间序列预测。第9章：注意力机制与Transformer —— 现代NLP的基石 9.1 注意力（Attention）机制的原理与魅力。 9.2 Transformer架构详解：自注意力、多头注意...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 10月28日

关于#爬虫#的问题：fieldnames=['电影名称','电影主角','上映日期','电影网址'](语言-python)

1条回答 默认 最新

问题事件

1条回答默认最新