python操作时表突然为空表了是什么原因

我在执行下面程序的时候，表突然值为空了，也无法正常操作了，想请教一下是什么原因


import pandas as pd
import numpy as np
import matplotlib.pyplot as plt


df = pd.read_csv(r"C:/Users/szp/Desktop/assignment1/MRV_2019.csv")#import file, the path of file may need to be change in differnt computer
df

#统计值为空的行
num = df.isna().sum()
num

#删除表中有'Division by zero!','Not Applicable'的行
df = df.replace(['Division by zero!','Not Applicable'],np.NaN)
df = df.dropna(how="any")
df

#check the data type
df.info()

#change data type
df[['Total fuel consumption [m tonnes]','Total CO2 emissions [m tonnes]','Annual Total time spent at sea [hours]', 'Annual average Fuel consumption per distance [kg / n mile]', 'Annual average CO2 emissions per distance [kg CO2 / n mile]']] = df[['Total fuel consumption [m tonnes]','Total CO2 emissions [m tonnes]','Annual Total time spent at sea [hours]', 'Annual average Fuel consumption per distance [kg / n mile]', 'Annual average CO2 emissions per distance [kg CO2 / n mile]']].astype('float64')

#check the data type again
df.info()

#把'Port of Registry'这列的内容全改成大写
df['Port of Registry'] = df['Port of Registry'].apply(lambda x: x.upper())
df

#将'Technical efficiency [gCO2/t·nm]'中的值分成两列，一列只有EEDI或EVI，另一列只有数值，并删除'Technical efficiency [gCO2/t·nm]'列
eff = df['Technical efficiency [gCO2/t·nm]'].str.split('(',expand=True)
eff.columns = ['Technical Efficiency Index','Technical Efficiency Value']
eff['Technical Efficiency Value'] = eff['Technical Efficiency Value'].str.rstrip(')')
df = pd.concat([df,eff], axis=1)
df = df.drop('Technical efficiency [gCO2/t·nm]', axis=1)
df

#move 'Technical Efficiency Index', 'Technical Efficiency Value' to other place
title = df.columns.tolist()
title.insert(3, title.pop(title.index('Technical Efficiency Index')))
title.insert(4, title.pop(title.index('Technical Efficiency Value')))
df = df[title]

#delete the empty unit in technical efficiency value
df = df.dropna(axis=0, how='any')
df

#调用sqlite
import sqlite3

#建立与表mrv2019的连接
connection = sqlite3.connect('mrv2019.db')

#Creating a cursor object using the cursor() method
cursor = connection.cursor()

#Doping mrv2019 table if already exists.
cursor.execute("DROP TABLE IF EXISTS mrv2019")

#Creating table as per requirement
sql = '''CREATE TABLE mrv2019(
    IMO PRIMARY KEY, 
    Name TEXT,
    Type INTEGER,
    TechnicEfficiencyIndex VARCHAR,
    TechnicalEfficiencyValue NUMERIC,
    PortofRegistry VARCHAR,
    DoCissue TEXT,
    DoCexpiry TEXT,
    VerifierName VARCHAR,
    VerifierCountry VARCHAR,
    TotalFuel NUMERIC,
    TotalCO2 NUMERIC,
    TimeatSea NUMERIC,
    FuelperMile NUMERIC,
    CO2perMile NUMERIC
);'''
cursor.execute(sql)

# Commit the changes in the database
connection.commit()


#向新建的表填充数据
cursor = connection.cursor()

for index, row in df.iterrows():
    cursor.execute("INSERT INTO mrv2019 VALUES (? ,? ,? ,? ,? ,? ,? ,? ,? ,? ,? ,? ,? ,?, ?)", (row['IMO Number'], row['Name'], row['Ship type'], row['Technical Efficiency Index'], row['Technical Efficiency Value'], row['Port of Registry'], row['DoC issue date'], row['DoC expiry date'], row['Verifier Name'], row['Verifier Country'], row['Total fuel consumption [m tonnes]'], row['Total CO2 emissions [m tonnes]'], row['Annual Total time spent at sea [hours]'], row['Annual average Fuel consumption per distance [kg / n mile]'], row['Annual average CO2 emissions per distance [kg CO2 / n mile]']
))


#对PortofRegistry列进行统计计算，得出不同港出现的次数，并把排名前21的港显示出来，画出bar图
sql = pd.read_sql("SELECT (PortofRegistry) AS name, COUNT(*) FROM mrv2019 Limit21", connection)
sql

#新建两个以IMO number为索引的表，一个表只含有Technical Efficiency Index为EEDI的船舶信息，另一个表只含有Technical Efficiency Index为EVI的船舶信息
df_eedi = df[df["Technical Efficiency Index"] == "EEDI"]
df_eedi.set_index('IMO Number')
df_evi = df[df["Technical Efficiency Index"] == "EIV"]
df_evi.set_index('IMO Number')

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN专家-黄老师 2021-09-28 16:45
关注
你看看数据写入操作（cursor.execute("INSERT INTO mrv2019 VALUES....）是否执行了，然后看看这句话pd.read_sql("SELECT (PortofRegistry) AS name, COUNT(*) FROM mrv2019 Limit21", connection)的SQL能否正常查询数据。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

大数据与 Python：开启智慧之门的钥匙
2024-12-20 08:59

lzzy_mzh_0837的博客我相信，在未来的日子里，Python 将继续陪伴我在大数据的海洋中畅游，让我能够挖掘出更多数据的价值，为这个数字化的时代贡献自己的一份力量。而 NumPy 库则为我提供了强大的数值计算能力，在处理复杂的数学运算和...
诊断性分析秘籍：如何快速定位大数据作业失败原因？
2025-08-15 02:54

光子AI的博客在当今数据驱动的世界中，大数据作业已成为企业决策和业务运营的核心...通过融合计算机科学原理、数据工程实践和故障排除心理学，我们将带领读者掌握从"是什么故障"到"为什么发生故障"再到"如何防止故障"的全流程技能。
Python3.11与PySpark：大数据云端实验平台
2026-01-16 01:50

HessoniteWolf99的博客本文介绍了如何基于“星图GPU”平台，自动化部署预装Python3.11与PySpark的云端实验环境。通过该镜像，用户可快速搭建专属大数据分析平台，典型应用于课程作业中的日志分析、数据清洗与统计建模等任务，显著提升实验...
Python调用LLM API流式与非流式输出比较[代码]
2025-11-13 07:45

在Python编程语言中，调用大型语言模型（LLM）的API是一个常见的操作，这一过程可以利用流式与非流式输出两种不同的数据处理方式。非流式输出意味着在数据处理完成并完全生成后，系统才会将结果返回给用户。这种方式...
大数据领域数据建模的环保大数据监测应用
2025-10-05 21:46

光子AI的博客环保大数据监测：通过多源数据（传感器、卫星、手工、社交媒体）收集环境要素（空气、水、土壤、生态）的状态数据，实现“实时监测、风险预警、溯源分析”的系统。大数据数据建模：对海量、异构的环境数据进行“结构...
面试宝典：深入理解这110道python面试题，AI和大数据向你招手
2019-04-02 08:45

喜欢打酱油的老鸟的博客 1、一行代码实现1--100之和利用sum()函数求和 ...2、如何在一个函数内部修改全局变量 ...3、列出5个python标准库 ...os：提供了不少与操作系统相关联的函数 sys: 通常用于命令行参数 re: 正则匹配 ...
为什么我在用SPSS里的process分析数据时显示结果错误？我用的是process3.3
2025-07-22 16:27

cda2024的博客你是否也遇到过这样的困境：在使用 SPSS 的 PROCESS 宏进行数据分析时，突然发现结果完全不符合预期，甚至出现明显的错误提示？面对 PROCESS 分析中可能出现的各种错误，最重要的是保持积极的学习态度。其次，模型...
python使用happybase库操作hbase
2020-10-17 20:05

玩家_名狱的博客若想深入理解Hbase的系统...使用happybase库操作hbase 先安装该库 pip install happybase 然后确保 hadoop 和 hbase 可用并开启能进行hdfs操作就代表hadoop正常运行能在 hbase shell 下使用 list 命令并不报错就代
栈的底层实现原理：数组栈vs链表栈性能对比
2025-06-15 01:21

AI Agent 大模型与大数据算法的博客栈是计算机世界最基础的数据结构之...本文将按照“概念引入→核心操作拆解→两种实现原理→性能对比实验→工程选择指南”的逻辑展开。通过生活案例、代码示例、性能测试数据三重维度，帮你建立对栈实现的深度认知。栈。
解析大数据领域数据可视化的设计原则
2025-10-05 16:42

光子AI的博客 大数据可视化（Big Data Visualization）是指通过图形、图像、交互界面等方式，将大数据集中的信息进行抽象、编码和呈现，帮助用户快速理解数据中的模式、趋势、异常和关系的技术。处理规模：支持TB级以上数据的实时...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 10月6日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 9月28日

python操作时表突然为空表了是什么原因

1条回答 默认 最新

问题事件

1条回答默认最新