python爬取股票数据

写一个爬虫代码，从新浪财经爬取中国船舶至少400个交易日的股票数据，显示效果为第1列：股票代码、第2列：交易日期、第3列：收盘价、第4列：最高价、第5列：最低价、第6列：开盘价、第7列：前收盘、第8列：涨跌额、第9列：涨跌幅、第10列：换手率、第11列：成交量、第12列：成交金额、第13列：总市值、第14列：流通市值

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-05-07 21:18
关注
引自免费微信小程序：皆我百晓生

要编写一个Python爬虫来获取新浪财经上的中国船舶（股票代码：600150）的历史数据，你需要使用requests库来发送HTTP请求，BeautifulSoup库来解析HTML页面，以及pandas库来处理数据。下面是一个详细的步骤指南和代码示例。

首先确保安装了所需的库：

pip install requests beautifulsoup4 pandas

接下来，我会提供一个完整的Python脚本，用于爬取股票历史数据并将其保存到CSV文件中。请注意，由于新浪财经网站的数据是动态加载的，我们无法直接通过普通的GET请求获取所有数据。这里我们将使用Selenium库来模拟浏览器行为，以便获取完整的HTML内容。

Step 1: 安装Selenium库：

pip install selenium

Step 2: 下载ChromeDriver（根据你的浏览器版本选择合适的驱动程序），并将其添加到系统的PATH环境变量中。下载地址

Step 3: 使用以下Python代码编写爬虫：

import os import time import pandas as pd from bs4 import BeautifulSoup from selenium import webdriver from selenium.webdriver.chrome.options import Options # 设置股票代码 stock_code = "600150" # 设置网页URL url = f"https://vip.stock.finance.sina.com.cn/q/go.php/vCISSKLine/kind/szsh/index.phtml?symbol={stock_code}" # 创建ChromeOptions对象，并禁用图片加载以加快速度 chrome_options = Options() chrome_options.add_argument("--headless") # 无头模式，不打开浏览器窗口 chrome_options.add_argument("--disable-gpu") chrome_options.add_argument("--no-sandbox") # 初始化webdriver driver = webdriver.Chrome(options=chrome_options) driver.implicitly_wait(10) # 等待元素加载时间 # 访问股票页面 driver.get(url) # 获取表格数据 data_rows = driver.find_elements_by_xpath("//table[@id='kline_table']/tbody/tr") data_list = [] # 遍历行并提取数据 for row in data_rows: cols = row.find_elements_by_tag_name("td") cols_data = [col.text.strip() for col in cols] data_list.append(cols_data) # 关闭webdriver driver.quit() # 将数据转换为DataFrame df = pd.DataFrame(data_list, columns=[ '交易日期', '开盘价', '最高价', '最低价', '收盘价', '涨跌额', '涨跌幅', '振幅', '换手率', '成交量', '成交金额', '市盈率(TTM)', '市净率', '流通市值' ]) # 格式化日期列 df['交易日期'] = pd.to_datetime(df['交易日期'], format='%Y-%m-%d') # 输出数据 print(df) # 保存到CSV文件 df.to_csv(f"{stock_code}_history.csv", index=False)

这段代码会打开一个新的无头Chrome浏览器窗口，访问指定的股票页面，然后抓取历史数据。注意，这个过程可能会比较慢，因为每次请求都需要等待页面加载完成。爬取完成后，数据将被保存为CSV文件。

由于新浪财经网站的数据可能有更新频率限制，频繁请求可能会导致IP被封禁。在实际操作时，你可能需要加入一些延迟机制，例如使用time.sleep()函数在请求之间插入一定的时间间隔，或者使用更复杂的反爬策略，比如设置代理IP等。

此外，由于网络环境和个人电脑性能的不同，实际运行结果可能会有所不同。如果遇到任何问题，可以检查网络连接、Selenium和ChromeDriver的配置是否正确。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
python 爬取数据数据缺失 python
2022-11-25 20:06

回答 2 已采纳它这个做了一点点反扒，你需要把标签里面的5取出来，和你的0.9拼在一起。试试下面这个看行不 Moive_score1 = li.xpath('./i/b/text()') Moive_score2 =
python爬取数据遇到的一些问题 python
2021-11-24 07:07

回答 5 已采纳 import requests url = r'https://hugovk.github.io/top-pypi-packages/top-pypi-packages-30-days.min.js
Python 爬取股票数据源码实现方案
2024-03-19 15:07

在Python编程语言中，爬取股票数据是一种常见的任务，尤其对于数据分析、投资研究以及金融建模的从业者来说，这是获取实时或历史股票信息的重要手段。本实现方案将深入探讨如何利用Python来爬取股票数据，并提供相关...
python 爬取表格获取不到数据 python
2020-02-17 22:52

回答 4 已采纳爬取需要在请求头里面添加Host，要不然爬取不到任何信息，另外源码是不规则的html代码，所以需要指定html解析器 ``` # -*- coding：utf-8 -*- import os
为什么用python 爬取数据到excel中300多行只剩下一行？ python vscode 开发语言有问必答
2021-08-01 12:32

回答 4 已采纳将写入文件语句放到循环外，加上列名并逐行写入，后面的代码可以这样写： #code with open('data/51job.csv','w') as f: f.write(','.join(
怎么样用Python爬取数据 python
2022-10-12 10:57

回答 2 已采纳爬取代码如下，如有帮助请点击一下采纳谢谢： import requests headers = { "authority": "pythonscraping.com", "acc
python爬取股票数据——基础篇
2023-11-03 15:09

程序员晓晓的博客这里需要注意，baostock爬取的股票复权数据采用的是涨跌幅复权法，这种方式计算的股票复权价与你的股票交易软件计算的结果是不同的。
python爬取码市导入excel中导入结果只导入最后一条的问题 python 数据分析爬虫
2021-08-15 19:24

回答 3 已采纳修改了一下程序，有帮助的话，望采纳！ #!/usr/bin/python # -*- coding: UTF-8 -*- """ @author: Roc-xb """ import requ
如何使用python爬取canvas中的内容呢？ css javascript python
2022-04-29 10:30

回答 1 已采纳需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。后端python处理： import cv2 as cvfrom encodings import base
python爬取网页题库如何将选项一一对应 python
2022-10-06 15:37

回答 1 已采纳拿去 import requests from bs4 import BeautifulSoup url_list = [] option_one = [] option_two = [] op =
Python爬取股票信息，并可视化数据的示例
2020-09-27 10:29

1. Python爬虫的基础使用：Python作为一门高效的编程语言，常被用来编写爬虫程序。爬虫是一种自动化获取网页内容的程序，可以模拟浏览器的行为，对目标网站的页面内容进行抓取和分析。在本例中，Python的requests库...
Python爬取的数据无法创建Excel进行保存 python 有问必答
2022-03-01 00:42

回答 2 已采纳你 return datalist 返回退出函数了return datalist 之后的代码就不会执行了你把return datalist 放到函数的最后即可如有帮助，请点击我的回答下方的【采纳该
Python爬取数据并写入MySQL数据库的实例
2020-09-09 09:15

在本实例中，我们将探讨如何使用Python编程语言从网页抓取数据并将其存储到MySQL数据库中。这个过程涉及两个主要部分：数据爬取和数据库操作。 1. **数据爬取**：数据爬取通常使用Python中的第三方库，如...
基于Python编程语言的水文数据爬取设计源码
2024-10-01 07:42

本项目是一款基于Python编程语言的水文数据爬取系统源码，总计包含80个文件，涵盖51个xlsx数据文件、9个pyc编译文件、7个Python源文件、5个xml配置文件、2个txt文本文件、1个gitignore忽略文件、1个iml项目文件、1个...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月7日

悬赏问题

¥100 如何寻找到黑客帮助，愿意付丰厚的酬劳
¥15 java代码写在记事本上后在cmd上运行时无报错但又没生成文件
¥15 关于#python#的问题：在跑ldsc数据整理的时候一直抱这种错误，要么--out识别不了参数，要么--merge-alleles识别不了参数(操作系统-linux)
¥15 PPOCRLabel
¥15 混合键合键合机对准标识
¥100 现在不懂的是如何将当前的相机中的照片,作为纹理贴图,映射到扫描出的模型上
¥15 魔霸ROG7 pro,win11.息屏后会显示黑屏,如图，如何解决？(关键词-重新启动)
¥15 有没有人知道这是哪里出了问题啊？要怎么改呀？
¥200 C++表格文件处理-悬赏
¥15 Windows Server2016本地登录失败

python爬取股票数据

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新