用pandas读写本地保存的html网页数据时,所有数据都在一列之中,怎么让他显示成表格的形式??谢谢

各位大神好,我再用pandas导入本地保存的html网页数据时,报错提示 No tables founnd,网页里面是有table数据的,为什么会报错。代码如下:

import pandas as pd
#读入的是本地保存的网页
df=pd.read_html(r'file:///Y:/%E6%97%A5%E7%BB%93%E7%AE%97%E6%95%B0%E6%8D%AE/%E6%B1%87%E6%80%BB%E6%8C%81%E4%BB%93/V6V8%E5%AF%B9%E6%95%B0/opts%E8%B5%84%E9%87%91.htm',header=0)
df2=pd.DataFrame(df)

df2.to_excel(
    excel_writer=r'E:\python\text1\data-output\ota66.xlsx',
    index=False)  # 导出的数据为excel格式,可以直接查看

图片说明

读写之后,然后转换成dataframe格式,没有生效,导出来的所有数据全部在一列里面,并没有进行分隔成多列表格的正常格式。
试了下用split分割也没有成功
拜托哪位大神帮忙给看看,看看要怎么修改代码,才能最后输出正常的表格形式的数据,非常感谢!

1个回答

ops1 = pd.read_csv(path3,header=0,encoding='gb2312',delim_whitespace=True,index_col=0)

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
使用pandas模块保存的图片日期不更新
问题: 使用pandas模块保存的图片日期不更新 代码: ![图片说明](https://img-ask.csdn.net/upload/201907/23/1563870095_779425.png) 在图片保存的目录下查看: ![图片说明](https://img-ask.csdn.net/upload/201907/23/1563870204_907505.png) 结果: 这张图片我在15:55的时候生成过,现在16:14再生成一次时间点还显示的是15:55,但是图片里面的内容确实是16:14的内容 请问为啥图片日期不会自动更新啊?
pandas如何实现缺失的行数据按上一行数据进行填充?
![图1:原始表格](https://img-ask.csdn.net/upload/201908/31/1567241120_445483.png) ![图2:实现的效果](https://img-ask.csdn.net/upload/201908/31/1567241470_237048.png) 如图1所示,黄色区域的数据为空,如何用pandas实现行数据的填充,填充后的效果如图2所示。
pandas如何显示全部数据而不是省略号
现用pandas读取数据并选取其中一行想要输出,但是输出过程中数据并未全部显示,中间的部分用省略号代替了,如何能让其显示全部数据?
pandas关于csv的读取和写入问题
1、利用pandas.read_csv读取数据后再用pandas.to_csv写入数据,在新写入的数据里,多出了一行是为什么呢?对比了一下读取的和写入的数据,差别在于,写入的数据在中间多出一行空白行。 ``` import pandas as pd train=pd.read_csv(r'F:\data1\train.tsv', sep='\t',header=0) train.to_csv(r'F:\data2\train2.tsv', encoding='utf_8_sig',sep='\t', header=False,index=True) ``` 读入的数据是:![图片说明](https://img-ask.csdn.net/upload/201911/13/1573642507_391031.png) 写入后的数据是:![图片说明](https://img-ask.csdn.net/upload/201911/13/1573642607_667954.png)
pandas如何根据一行数据,添加对应的行数据
请教大神,如何用pandas实现图片中的效果 ![图片说明](https://img-ask.csdn.net/upload/201909/09/1568037123_840972.png)
pandas清洗数据,假如日期数据中,标准格式是“xxxx-xx-xx”,要怎么把所有非标准的数据找出来呢?
![图片说明](https://img-ask.csdn.net/upload/201904/06/1554542036_438384.jpg) 如图所示。标准格式是“xxxx-xx-xx”,其中有一些非标准格式的比如“xxxx年xx月xx日”以及其他的不同的非标准格式,每一种非标准格式的清洗方法都不一样,所以要查看所有的非标准数据格式,我要怎么把这些数据显示出来呢? 用pandas清洗的时候我试过用正则表达式匹配再取反,但是不成功。如果数据很多,也不能一一展示出来的时候,应该用什么方法把这些非标准格式的数据查找出来呢? 我刚开始自学pandas数据清洗,请多多包涵。
pandas dataframe数据结构,想检查索引列中的数据是否唯一怎么检查
如题 pandas dataframe数据结构,想检查索引列中的数据是否唯一怎么检查 不知道pandas中有没有这样的函数
Python,pandas的series数据格式转化问题
你好: 我的源数据格式为: ![图片说明](https://img-ask.csdn.net/upload/201811/13/1542099212_203444.jpg) 我想转化为的格式: ![图片说明](https://img-ask.csdn.net/upload/201811/13/1542099281_738098.jpg) 也就是说我想把源数据中每一个数据项中每一个数组中的数据取出来,单独组成一个series 请问pandas中有没有什么合适的方法? 当然一个个取出来然后用for也行,但效率太慢,除了这种方式还有其他方式么? 谢谢~
python pandas排序问题
原始数据的excel表格,如下图 ![图片说明](https://img-ask.csdn.net/upload/202001/15/1579088832_399765.png) 想用python的pandas把excel变成按相同地点和按相同地点的数量由大到小排序,如下图 ![图片说明](https://img-ask.csdn.net/upload/202001/16/1579150058_389867.png)
pandas中reindex原来的数据从int自动变成float
pandas中reindex为什么会把原来的数据从int自动变成float,应该怎么保持数据格式不变。
pandas的dataframe的同一id的多行数据按其中一个特征将数据平铺该怎么简洁操作?
![图片说明](https://img-ask.csdn.net/upload/202001/15/1579069054_942084.png) 问题描述的效果如上图所示,python里有什么函数有这功能或有什么简洁高效的代码可以实现呢?
pandas处理数据,如何把一列的数据拆分成多列?求大神帮助。
pandas处理数据,如何把一列的数据拆分成多列?求大神帮助。![图片说明](https://img-ask.csdn.net/upload/201905/30/1559216250_54146.png)
pandas 绘制盒图时怎么确定哪些数据绘制为离散点的
![图片说明](https://img-ask.csdn.net/upload/201607/18/1468846804_730684.png) 在用pandas展现数据时,一些数据在盒图中显示为了离散点。 ``` df_qs_hb[-60:][['dx_gwxz']].boxplot() plt.show() ``` 我的小白问题: pandan在绘制盒图时,是依据什么来确定哪些数据为离散点。
pandas 多重索引的数据选择
加入我有如下数据: ``` dates 0 numbers letters 0 a 2013-01-01 0.261092 2013-01-02 -1.267770 2013-01-03 0.008230 b 2013-01-01 -1.515866 2013-01-02 0.351942 2013-01-03 -0.245463 c 2013-01-01 -0.253103 2013-01-02 -0.385411 2013-01-03 -1.740821 1 a 2013-01-01 -0.108325 2013-01-02 -0.212350 2013-01-03 0.021097 b 2013-01-01 -1.922214 2013-01-02 -1.769003 2013-01-03 -0.594216 c 2013-01-01 -0.419775 2013-01-02 1.511700 2013-01-03 0.994332 2 a 2013-01-01 -0.020299 2013-01-02 -0.749474 2013-01-03 -1.478558 b 2013-01-01 -1.357671 2013-01-02 0.161185 2013-01-03 -0.658246 c 2013-01-01 -0.564796 2013-01-02 -0.333106 2013-01-03 -2.814611 ``` 我想要选择(0, 'b')和(1, 'c')的数据构建一个新的dataframe,请问怎么实现?
pandas处理excel中列名为中文的问题
刚学pandas处理数据,导入excel表后想利用列名索引的方式['列名']或.列名提取数据 发现有的列数据可以提有的搜列名就是keyerror 就又看了下第一行数据,发现第一行数据对应的列名可以以提取的数据排列整齐,不可以提取的其实是列名后还存在空格,使用列名加相应的空格就可以提取不报keyerror 这什么情况,是不pandas可以处理中文列名,但是数据格式要统一? 我先把excel表中的列明数据格式都改为了数值,然后用格式刷把所有列名数据刷了一遍,再提取,并没改变。 有人遇到过这个问题吗,咋处理,看到网上有人是写dict的,有直接处理的吗?
如何用python pandas按某列中字符长度等于18位的条件 筛选出excel表中所有数据?
比如,一个excel 表中,有一列是各类证件号,如何用python pandas 方法,按按某列中字符长度等于18位的条件 筛选出excel表中所有数据。这个条件如何写?
请问用pandas包读取csv后绘制的hist图时如何修正数据?
``` travel = pd.read_csv("travel insurance.csv", low_memory=False) role=travel[travel["Age"]>=100] print(role["Agency"]) lengh = len(pd.unique(role["Agency"])) plt.hist(role["Agency"],lengh,facecolor='green',alpha=0.5) plt.show() ``` 我想通过以上代码找出特定条件下(AGE>=100)每个Agency出现的频率。但是得到的条形统计图如下所示 ![图片说明](https://img-ask.csdn.net/upload/201911/08/1573228764_147569.png) 图片出现很多细条,似乎每出现一次就画一道。打印role["Agency"]后得到下图所示的数据,是否会有影响啊? ![图片说明](https://img-ask.csdn.net/upload/201911/09/1573228940_742570.png)
python pandas的使用问题
大家好,我在使用pandas做数据处理时想要对缺失进行处理,根据不同的情况缺失赋予不同的值,如下 source Fact_amount income amount_rate 143360 **车贷中心 11333.333330 NaN NaN 143361 **车贷中心 56666.666670 NaN NaN 以下代码 for i in range(0,143364): if math.isnan(df.loc[i].income): df.ix[i].income=d[df.ix[i].source[0:2]] 但是在循环内修改数据时就会报错 A value is trying to be set on a copy of a slice from a DataFrame See the caveats in the documentation--大神们救我~
pandas如何把一个csv中的所有数据合并到一列
rt 将所有行的数据变成一行 input 1 2 3 4 5 6 7 8 9 output 1 2 3 4 5 6 7 8 9
Java学习的正确打开方式
在博主认为,对于入门级学习java的最佳学习方法莫过于视频+博客+书籍+总结,前三者博主将淋漓尽致地挥毫于这篇博客文章中,至于总结在于个人,实际上越到后面你会发现学习的最好方式就是阅读参考官方文档其次就是国内的书籍,博客次之,这又是一个层次了,这里暂时不提后面再谈。博主将为各位入门java保驾护航,各位只管冲鸭!!!上天是公平的,只要不辜负时间,时间自然不会辜负你。 何谓学习?博主所理解的学习,它是一个过程,是一个不断累积、不断沉淀、不断总结、善于传达自己的个人见解以及乐于分享的过程。
程序员必须掌握的核心算法有哪些?
由于我之前一直强调数据结构以及算法学习的重要性,所以就有一些读者经常问我,数据结构与算法应该要学习到哪个程度呢?,说实话,这个问题我不知道要怎么回答你,主要取决于你想学习到哪些程度,不过针对这个问题,我稍微总结一下我学过的算法知识点,以及我觉得值得学习的算法。这些算法与数据结构的学习大多数是零散的,并没有一本把他们全部覆盖的书籍。下面是我觉得值得学习的一些算法以及数据结构,当然,我也会整理一些看过...
前端 | 2. 正则
转载请注明以下: 本文转自清自以敬的博客:https://blog.csdn.net/qq_45791147 文章目录1.转义2.正则表达式初步2.1.匹配字符2.1.1.组成元素2.1.2.基础正则的设计 1.转义 转义的作用: 当某个字符在表达式中具有特殊含义,例如字符串引号中出现了引号,为了可以使用这些字符本身,而不是使用其在表达式中的特殊含义,则需要通过转义符“\”来构建该字符转义...
有哪些让程序员受益终生的建议
从业五年多,辗转两个大厂,出过书,创过业,从技术小白成长为基层管理,联合几个业内大牛回答下这个问题,希望能帮到大家,记得帮我点赞哦。 敲黑板!!!读了这篇文章,你将知道如何才能进大厂,如何实现财务自由,如何在工作中游刃有余,这篇文章很长,但绝对是精品,记得帮我点赞哦!!!! 一腔肺腑之言,能看进去多少,就看你自己了!!! 目录: 在校生篇: 为什么要尽量进大厂? 如何选择语言及方...
大学四年自学走来,这些私藏的实用工具/学习网站我贡献出来了
大学四年,看课本是不可能一直看课本的了,对于学习,特别是自学,善于搜索网上的一些资源来辅助,还是非常有必要的,下面我就把这几年私藏的各种资源,网站贡献出来给你们。主要有:电子书搜索、实用工具、在线视频学习网站、非视频学习网站、软件下载、面试/求职必备网站。 注意:文中提到的所有资源,文末我都给你整理好了,你们只管拿去,如果觉得不错,转发、分享就是最大的支持了。 一、电子书搜索 对于大部分程序员...
linux系列之常用运维命令整理笔录
本博客记录工作中需要的linux运维命令,大学时候开始接触linux,会一些基本操作,可是都没有整理起来,加上是做开发,不做运维,有些命令忘记了,所以现在整理成博客,当然vi,文件操作等就不介绍了,慢慢积累一些其它拓展的命令,博客不定时更新 free -m 其中:m表示兆,也可以用g,注意都要小写 Men:表示物理内存统计 total:表示物理内存总数(total=used+free) use...
比特币原理详解
一、什么是比特币 比特币是一种电子货币,是一种基于密码学的货币,在2008年11月1日由中本聪发表比特币白皮书,文中提出了一种去中心化的电子记账系统,我们平时的电子现金是银行来记账,因为银行的背后是国家信用。去中心化电子记账系统是参与者共同记账。比特币可以防止主权危机、信用风险。其好处不多做赘述,这一层面介绍的文章很多,本文主要从更深层的技术原理角度进行介绍。 二、问题引入 假设现有4个人...
程序员接私活怎样防止做完了不给钱?
首先跟大家说明一点,我们做 IT 类的外包开发,是非标品开发,所以很有可能在开发过程中会有这样那样的需求修改,而这种需求修改很容易造成扯皮,进而影响到费用支付,甚至出现做完了项目收不到钱的情况。 那么,怎么保证自己的薪酬安全呢? 我们在开工前,一定要做好一些证据方面的准备(也就是“讨薪”的理论依据),这其中最重要的就是需求文档和验收标准。一定要让需求方提供这两个文档资料作为开发的基础。之后开发...
网页实现一个简单的音乐播放器(大佬别看。(⊙﹏⊙))
今天闲着无事,就想写点东西。然后听了下歌,就打算写个播放器。 于是乎用h5 audio的加上js简单的播放器完工了。 演示地点演示 html代码如下` music 这个年纪 七月的风 音乐 ` 然后就是css`*{ margin: 0; padding: 0; text-decoration: none; list-...
Python十大装B语法
Python 是一种代表简单思想的语言,其语法相对简单,很容易上手。不过,如果就此小视 Python 语法的精妙和深邃,那就大错特错了。本文精心筛选了最能展现 Python 语法之精妙的十个知识点,并附上详细的实例代码。如能在实战中融会贯通、灵活使用,必将使代码更为精炼、高效,同时也会极大提升代码B格,使之看上去更老练,读起来更优雅。
数据库优化 - SQL优化
以实际SQL入手,带你一步一步走上SQL优化之路!
2019年11月中国大陆编程语言排行榜
2019年11月2日,我统计了某招聘网站,获得有效程序员招聘数据9万条。针对招聘信息,提取编程语言关键字,并统计如下: 编程语言比例 rank pl_ percentage 1 java 33.62% 2 cpp 16.42% 3 c_sharp 12.82% 4 javascript 12.31% 5 python 7.93% 6 go 7.25% 7 p...
通俗易懂地给女朋友讲:线程池的内部原理
餐盘在灯光的照耀下格外晶莹洁白,女朋友拿起红酒杯轻轻地抿了一小口,对我说:“经常听你说线程池,到底线程池到底是个什么原理?”
《奇巧淫技》系列-python!!每天早上八点自动发送天气预报邮件到QQ邮箱
将代码部署服务器,每日早上定时获取到天气数据,并发送到邮箱。 也可以说是一个小型人工智障。 知识可以运用在不同地方,不一定非是天气预报。
经典算法(5)杨辉三角
杨辉三角 是经典算法,这篇博客对它的算法思想进行了讲解,并有完整的代码实现。
腾讯算法面试题:64匹马8个跑道需要多少轮才能选出最快的四匹?
昨天,有网友私信我,说去阿里面试,彻底的被打击到了。问了为什么网上大量使用ThreadLocal的源码都会加上private static?他被难住了,因为他从来都没有考虑过这个问题。无独有偶,今天笔者又发现有网友吐槽了一道腾讯的面试题,我们一起来看看。 腾讯算法面试题:64匹马8个跑道需要多少轮才能选出最快的四匹? 在互联网职场论坛,一名程序员发帖求助到。二面腾讯,其中一个算法题:64匹...
面试官:你连RESTful都不知道我怎么敢要你?
干货,2019 RESTful最贱实践
Docker 从入门到掉坑
Docker 介绍 简单的对docker进行介绍,可以把它理解为一个应用程序执行的容器。但是docker本身和虚拟机还是有较为明显的出入的。我大致归纳了一下,可以总结为以下几点: docker自身也有着很多的优点,关于它的优点,可以总结为以下几项: 安装docker 从 2017 年 3 月开始 docker 在原来的基础上分为两个分支版本: Docker CE 和 Doc...
为啥国人偏爱Mybatis,而老外喜欢Hibernate/JPA呢?
关于SQL和ORM的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行了一番讨论,感触还是有一些,于是就有了今天这篇文。 声明:本文不会下关于Mybatis和JPA两个持久层框架哪个更好这样的结论。只是摆事实,讲道理,所以,请各位看官勿喷。 一、事件起因 关于Mybatis和JPA孰优孰劣的问题,争论已经很多年了。一直也没有结论,毕竟每个人的喜好和习惯是大不相同的。我也看...
白话阿里巴巴Java开发手册高级篇
不久前,阿里巴巴发布了《阿里巴巴Java开发手册》,总结了阿里巴巴内部实际项目开发过程中开发人员应该遵守的研发流程规范,这些流程规范在一定程度上能够保证最终的项目交付质量,通过在时间中总结模式,并推广给广大开发人员,来避免研发人员在实践中容易犯的错误,确保最终在大规模协作的项目中达成既定目标。 无独有偶,笔者去年在公司里负责升级和制定研发流程、设计模板、设计标准、代码标准等规范,并在实际工作中进行...
SQL-小白最佳入门sql查询一
不要偷偷的查询我的个人资料,即使你再喜欢我,也不要这样,真的不好;
项目中的if else太多了,该怎么重构?
介绍 最近跟着公司的大佬开发了一款IM系统,类似QQ和微信哈,就是聊天软件。我们有一部分业务逻辑是这样的 if (msgType = "文本") { // dosomething } else if(msgType = "图片") { // doshomething } else if(msgType = "视频") { // doshomething } else { // doshom...
Nginx 原理和架构
Nginx 是一个免费的,开源的,高性能的 HTTP 服务器和反向代理,以及 IMAP / POP3 代理服务器。Nginx 以其高性能,稳定性,丰富的功能,简单的配置和低资源消耗而闻名。 Nginx 的整体架构 Nginx 里有一个 master 进程和多个 worker 进程。master 进程并不处理网络请求,主要负责调度工作进程:加载配置、启动工作进程及非停升级。worker 进程负责处...
Python 编程开发 实用经验和技巧
Python是一门很灵活的语言,也有很多实用的方法,有时候实现一个功能可以用多种方法实现,我这里总结了一些常用的方法和技巧,包括小数保留指定位小数、判断变量的数据类型、类方法@classmethod、制表符中文对齐、遍历字典、datetime.timedelta的使用等,会持续更新......
YouTube排名第一的励志英文演讲《Dream(梦想)》
Idon’t know what that dream is that you have, I don't care how disappointing it might have been as you've been working toward that dream,but that dream that you’re holding in your mind, that it’s po...
“狗屁不通文章生成器”登顶GitHub热榜,分分钟写出万字形式主义大作
一、垃圾文字生成器介绍 最近在浏览GitHub的时候,发现了这样一个骨骼清奇的雷人项目,而且热度还特别高。 项目中文名:狗屁不通文章生成器 项目英文名:BullshitGenerator 根据作者的介绍,他是偶尔需要一些中文文字用于GUI开发时测试文本渲染,因此开发了这个废话生成器。但由于生成的废话实在是太过富于哲理,所以最近已经被小伙伴们给玩坏了。 他的文风可能是这样的: 你发现,...
程序员:我终于知道post和get的区别
是一个老生常谈的话题,然而随着不断的学习,对于以前的认识有很多误区,所以还是需要不断地总结的,学而时习之,不亦说乎
《程序人生》系列-这个程序员只用了20行代码就拿了冠军
你知道的越多,你不知道的越多 点赞再看,养成习惯GitHub上已经开源https://github.com/JavaFamily,有一线大厂面试点脑图,欢迎Star和完善 前言 这一期不算《吊打面试官》系列的,所有没前言我直接开始。 絮叨 本来应该是没有这期的,看过我上期的小伙伴应该是知道的嘛,双十一比较忙嘛,要值班又要去帮忙拍摄年会的视频素材,还得搞个程序员一天的Vlog,还要写BU...
程序员把地府后台管理系统做出来了,还有3.0版本!12月7号最新消息:已在开发中有github地址
第一幕:缘起 听说阎王爷要做个生死簿后台管理系统,我们派去了一个程序员…… 996程序员做的梦: 第一场:团队招募 为了应对地府管理危机,阎王打算找“人”开发一套地府后台管理系统,于是就在地府总经办群中发了项目需求。 话说还是中国电信的信号好,地府都是满格,哈哈!!! 经常会有外行朋友问:看某网站做的不错,功能也简单,你帮忙做一下? 而这次,面对这样的需求,这个程序员...
网易云6亿用户音乐推荐算法
网易云音乐是音乐爱好者的集聚地,云音乐推荐系统致力于通过 AI 算法的落地,实现用户千人千面的个性化推荐,为用户带来不一样的听歌体验。 本次分享重点介绍 AI 算法在音乐推荐中的应用实践,以及在算法落地过程中遇到的挑战和解决方案。 将从如下两个部分展开: AI算法在音乐推荐中的应用 音乐场景下的 AI 思考 从 2013 年 4 月正式上线至今,网易云音乐平台持续提供着:乐屏社区、UGC...
相关热词 c# 引用mysql c#动态加载非托管dll c# 两个表数据同步 c# 返回浮点json c# imap 链接状态 c# 漂亮字 c# 上取整 除法 c#substring c#中延时关闭 c#线段拖拉
立即提问