wy777808 2020-04-07 15:55 采纳率: 100%

浏览 6433

已采纳

请问如何将第一行dataframe数据设置为列索引？而不使用默认索引

import pandas as pd
from selenium import webdriver
import re

#设置无界面浏览器模式，不弹出模拟浏览器窗口，让程序在后台运行
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
browser = webdriver.Chrome(options=chrome_options)

data_all = pd.DataFrame() # 创建一个空列表用来汇总所有的表格数据
for pg in range(1,60): # 可以将页码数调小进行快速尝试
url = 'http://yanbao.stock.hexun.com/ybsj5_' + str(pg)+ '.shtml'
browser.get(url) # 通过Selenium库访问网页
data = browser.page_source # 获取网页源码
table = pd.read_html(data)[0] # 通过pandas库提取表格数据
#print(table)

# 添加股票代码
p_code = '<a href="yb_(.*?).shtml'
code = re.findall(p_code, data)
# print(code)
# print(len(table))
# print(len(code))
# print(table['股票名称'])
table['股票代码'] = code

# 通过concat()函数将各页的表格纵向拼接成一个总的DataFrame
data_all = pd.concat([data_all, table], join='outer', ignore_index=True)

data_all.to_excel('分析师评级报告.xlsx', index=False)

访问网页并获取网页源代码

url = 'http://yanbao.stock.hexun.com/ybsj.aspx?type=5'
browser.get(url)
data = browser.page_source

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
吃鸡王者 2020-04-07 17:12
关注
data.columns=data.iloc[0].values
data=data.drop(0)
data=data.reset_index(drop=True)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 8
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

请问如何将第一行dataframe数据设置为列索引？而不使用默认索引 python 数据挖掘
2020-04-07 15:55

回答 1 已采纳 data.columns=data.iloc[0].values data=data.drop(0) data=data.reset_index(drop=True)
dataframe将某列数据变为column索引 python
2019-08-01 17:49

回答 2 已采纳您好，我建立了一个与你类似的DataFrame，大致的与您对应一下，希望能够帮到您。为了对应您后续补充的问题，其中2019-03-01和2018-06-30是各有一个股票无数据的。 **我的数据
pandas dataframe数据的列如何转换为列表？ python 数据分析
2022-04-24 10:52

回答 1 已采纳不是提示你了，看下你的数据里面有没有'Module-A'这一列
pandas使用duplicated函数删除dataframe中重复列名称的数据列、默认保留重复数据列中的第一个数据列(removing duplicate columns in dataframe)
2022-02-28 07:10

Data+Science+Insight的博客 pandas使用duplicated函数删除dataframe中重复列名称的数据列、默认保留重复数据列中的第一个数据列(removing duplicate columns in dataframe)
pandas增加一行数据，但不需要指定行的索引名称，如何实现？ python
2022-05-16 13:50

回答 1 已采纳可以用df.append：df1 = df.append({'names':'d','age':50},ignore_index = True)或者用df.loc：df.loc[3,'names']
python的DataFrame如何在新加的行前添加行索引 python 有问必答
2022-03-23 08:59

回答 6 已采纳 import pandas as pd a = [[1, 2, 3, 4], [1, 2, 3, 4], [1, 2, 3, 4]] data = pd.DataFrame(a, index=["o
请问python中，如何抓取dataframe的列数和第n列的数据？ python
2019-11-23 22:10

回答 2 已采纳 df.shape[1] 可以得到列数 df.iloc[:, [n]] 第n列
pandas使用read_excel函数读取excel表格数据为dataframe、设置sheet_name参数为表单索引位置列表则读取多个表单的数据并返回dataframe字典
2022-12-20 08:40

statistics.insight的博客 pandas使用read_excel函数读取excel表格数据为dataframe、使用sheet_name参数指定读取excel表格中指定的sheet表单、设置sheet_name参数为表单索引位置列表则读取多个表单的数据并返回dataframe字典
如何给Dataframe输出的excel，索引列进行重新命名 python
2021-08-25 14:53

回答 1 已采纳 reset_index() 重新索引，df.columns赋值新列名
如何用for循环选取dataframe中多列数据？ python 有问必答
2022-02-22 11:31

回答 2 已采纳 stock['A','B']是一个数据框类型，直接解包会出错，你可以这样操作： for x ,y in zip(stock['A'],stock['B']): print(x,y)
pandas dataframe 将同一索引下的两条数据合并
2017-06-15 03:32

回答 1 已采纳 table.groupby('time').sum()
pandas使用dataframe的索引和数据列同时对dataframe数据进行排序、使用by参数指定排序参数列表、第一个字段进行排序接着对第二个字段进行排序（默认升序）
2022-09-07 08:50

statistics.insight的博客 pandas使用dataframe的索引和数据列同时对dataframe数据进行排序、使用by参数指定排序参数列表、第一个字段进行排序接着对第二个字段进行排序（默认升序）
python dataframe读取数据后没法按列索引 list python 数据挖掘
2019-07-30 10:40

回答 1 已采纳读入数据是格式不对，调用read_table函数是，设定参数sep=" " (空格)
pandas读取csv数据、index_col参数指定作为行索引的数据列索引列表形成复合（多层）行索引、sort_index函数基于多层行索引对dataframe数据排序（默认升序排序）
2023-03-05 10:24

Data+Science+Insight的博客 pandas使用read_csv函数读取csv数据、index_col参数指定作为行索引的数据列索引列表形成复合（多层）行索引、sort_index函数基于多层行索引对dataframe数据排序（默认升序排序）
pandas读取csv数据、header参数指定作为列索引的行索引列表形成复合（多层）列索引、使用set_index函数把数据列转化为行索引（keys参数指定需要被转化的层列索引）
2022-12-24 09:25

Data+Science+Insight的博客 csv函数读取csv数据、index_col参数指定作为行索引的数据列索引列表形成复合（多层）行索引、header参数指定作为列索引的行索引列表形成复合（多层）列索引、使用set_index函数把数据列转化为行索引（keys参数指定...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
提问应符合社区要求 3月4日

悬赏问题

¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？
¥15 错误 LNK2001 无法解析的外部符号
¥50 安装pyaudiokits失败
¥15 计组这些题应该咋做呀
¥60 更换迈创SOL6M4AE卡的时候，驱动要重新装才能使用，怎么解决？
¥15 让node服务器有自动加载文件的功能
¥15 jmeter脚本回放有的是对的有的是错的
¥15 r语言蛋白组学相关问题