用python爬取数据出错

问题相关代码，请勿粘贴截图

import pandas as pd
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from time import sleep
import csv
# 这个爬虫爬取结果的最后几列需要手工处理（可能会多出来几列）

def get_infos(ID):
    driver.get(r"http://192.168.3.252/xhlisweb-inspection_id/XHlisWebReport.aspx")
    sleep(1)
    driver.find_element_by_name("txtoutpatient_id").send_keys(ID)
    driver.find_element_by_name("btnConfirm").click()
    cols = driver.find_elements_by_xpath('''//tr[contains(@onclick, "return btnClick")]''')
    times = len(cols)

    # 思路：挨个去点击一行的病员号，然后获取下方表格的信息
    # print(driver.page_source)
    # cols = driver.find_elements_by_xpath("//td[text()=" + ID + "]")

    # col = cols[4]
    # col_info = col.text.split(' ')[:14]
    # col.click()
    # items = driver.find_elements_by_xpath("//div[@id='report-content']//tbody//tr")[1:]
    # item = items[0]

    infos = []
    for i in range(times):
        driver.get(r"http://192.168.3.252/xhlisweb-inspection_id/XHlisWebReport.aspx")
        sleep(2)
        driver.find_element_by_name("txtoutpatient_id").send_keys(ID)
        driver.find_element_by_name("btnConfirm").click()
        cols = driver.find_elements_by_xpath('''//tr[contains(@onclick, "return btnClick")]''')
        col = cols[i]
        col_info = col.text.split(' ')[:14]
        col.click()
        items = driver.find_elements_by_xpath("//div[@id='report-content']//tbody//tr")[1:]
        for item in items:
            a = item.text.split(' ')
            try:
                a.remove('')
            except:
                pass
            # 这里要做点长度判断，如果a的长度大于7，那就截断；如果不够，就填充''
            #if len(a) <= 7:
            #    for i in range(7-len(a)):
            #        a.append('')
            #else:
            #    a = a[:7]
            infos.append([ID] + col_info + a)

    return infos


# start最小为0, end最大为641
start = 200
end = 641

data = pd.read_excel(r"C:\Users\cc\Desktop\资料\数据录入\ALL_raw.xlsx")
IDs = data['登记号'].tolist()[start:end]
# IDs = ["0005248871", '0010610644']

options = Options()
options.binary_location = r"C:\Users\newceshi\Desktop\蒋丽莎病历检查\pzwj\google\chrome.exe"
driver = webdriver.Chrome(r"C:\Users\newceshi\Desktop\蒋丽莎病历检查\pzwj\chromedriver.exe", chrome_options=options)
driver.maximize_window()

ALL = []
for ID in IDs:
    try:
        infos = get_infos(ID)
        ALL += infos
    except:
        pass

headers = ['ID', '序号', '检验单', '病员号', '类型', '送检', '目的', '姓名', '性别', '年龄', '科别', '病区', '工作组', '审核人员', '审核日期', '审核时间', 'NO', '英文名称', '检验项目', '结果', '单位', '状态', '参考值']
with open(r"result_检验_" + str(start) + "_" + str(end) +".csv", 'w', newline='') as f:
    f_csv = csv.writer(f)
    f_csv.writerow(headers)
    for i in ALL:
        f_csv.writerow(i)


sleep(3)
driver.quit()

运行结果及报错内容

C:\Users\cc\AppData\Local\Programs\Python\Python39\python.exe D:/Pycharm/data/chaxue4.py
Traceback (most recent call last):
  File "D:\Pycharm\data\chaxue4.py", line 58, in <module>
    data = pd.read_excel(r"C:\Users\cc\Desktop\资料\数据录入\ALL_raw.xlsx")
  File "C:\Users\cc\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\util\_decorators.py", line 311, in wrapper
    return func(*args, **kwargs)
  File "C:\Users\cc\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\io\excel\_base.py", line 364, in read_excel
    io = ExcelFile(io, storage_options=storage_options, engine=engine)
  File "C:\Users\cc\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\io\excel\_base.py", line 1233, in __init__
    self._reader = self._engines[engine](self._io, storage_options=storage_options)
  File "C:\Users\cc\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\io\excel\_openpyxl.py", line 521, in __init__
    import_optional_dependency("openpyxl")
  File "C:\Users\cc\AppData\Local\Programs\Python\Python39\lib\site-packages\pandas\compat\_optional.py", line 118, in import_optional_dependency
    raise ImportError(msg) from None
ImportError: Missing optional dependency 'openpyxl'.  Use pip or conda to install openpyxl.

Process finished with exit code 1

我的解答思路和尝试过的方法

我从别人那搞到的代码，但我电脑上运行的结果是这样，看不懂什么意思

我想要达到的结果

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
小僵尸打字员 2022-01-06 18:37
关注
那不很明显吗, 底层少包, 用pip安装 openpyxl

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python爬取数据+数据分析
2020-04-06 17:11

涛涛19148的博客爬取二手车之家的部分数据 # 爬取二手车网站的数据 #Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库 from bs4 import BeautifulSoup # 用于网络请求 import urllib.request #操作csv文件 import csv...
Python爬取微博数据实战教程（附完整代码）
2025-08-12 17:00

Python_trys的博客本文将详细介绍如何使用Python爬取微博数据，包括用户信息、微博内容、评论等，并提供完整的代码实现。建议初学者从移动端API开始尝试，遇到问题时可以结合Selenium解决。完整代码已提供，可以直接运行测试。使用...
新浪微博爬虫，用python爬取新浪微博数据.zip
2023-12-01 20:48

python爬虫# Weibo Spider本程序可以连续爬取**一个**或**多个**新浪微博用户（如[胡歌](https://weibo.cn/u/1223178222)、[迪丽热巴](https://weibo.cn/u/1669879400)、[郭碧婷](https://weibo.cn/u/1729370543)）...
python爬取aspx数据_如何利用Python爬取网站数据？
2021-02-04 05:41

那些年灬的羁绊的博客 1.基本方法其实用python爬取网页很简单，只有简单的几句话这样就可以获得到页面的内容。接下来再用正则匹配去匹配所需要的内容就行了。但是，真正要做起来，就会有各种各样的细节问题。2.登录这是一个需要登录认证的...
Python爬取天气数据实战教程：从入门到精通
2025-06-24 16:20

Python_trys的博客本文将介绍如何使用Python爬取天气数据，并存储为结构化格式，适合数据分析、可视化等后续处理。本教程以中国天气网（http://www.weather.com.cn）为例，爬取城市天气预报数据。希望本教程能帮助你掌握Python爬取...
手把手教你用Python爬取全国天气数据（附可视化技巧）
2025-05-15 20:45

siliconscribe的博客爬虫虽好，可不要贪杯哦~（你懂的！遵守网站robots协议控制请求频率不要用于商业用途及时删除敏感数据遇到问题欢迎评论区交流，代码亲测有效，赶紧跑起来试试吧！
python爬取行政区划数据
2024-10-26 10:25

hy_208的博客 python爬取全国行政区划数据省市区街道村
如何用Python爬取全部ETF基金实时数据！
2024-09-18 10:33

jnfy的博客如何用Python爬取全部ETF基金实时数据！
python爬取大众点评数据_python爬虫实例详细介绍之爬取大众点评的数据
2020-11-20 18:57

weixin_39785858的博客 python 爬虫实例详细介绍之爬取大众点评的数据一．Python作为一种语法简洁、面向对象的解释性语言，其便捷性、容易上手性受到众多程序员的青睐，基于python的包也越来越多，使得python能够帮助我们实现越来越多的...
使用python爬取百度搜索中关于python相关的数据信息
2025-05-02 20:51

code_shenbing的博客简单爬取可以使用requests+BeautifulSoup反爬严格时使用Selenium注意设置合理的请求间隔和User-Agent考虑使用代理IP池遵守法律法规和网站使用条款注意：实际使用时，请确保遵守百度的使用条款和相关法律法规，不要...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 1月16日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 1月8日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 1月6日

用python爬取数据出错

问题相关代码，请勿粘贴截图

运行结果及报错内容

我的解答思路和尝试过的方法

我想要达到的结果

2条回答 默认 最新

问题事件

2条回答默认最新