wy777808 2020-04-07 15:55 采纳率: 100%

浏览 6472

已采纳

请问如何将第一行dataframe数据设置为列索引？而不使用默认索引

import pandas as pd
from selenium import webdriver
import re

#设置无界面浏览器模式，不弹出模拟浏览器窗口，让程序在后台运行
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
browser = webdriver.Chrome(options=chrome_options)

data_all = pd.DataFrame() # 创建一个空列表用来汇总所有的表格数据
for pg in range(1,60): # 可以将页码数调小进行快速尝试
url = 'http://yanbao.stock.hexun.com/ybsj5_' + str(pg)+ '.shtml'
browser.get(url) # 通过Selenium库访问网页
data = browser.page_source # 获取网页源码
table = pd.read_html(data)[0] # 通过pandas库提取表格数据
#print(table)

# 添加股票代码
p_code = '<a href="yb_(.*?).shtml'
code = re.findall(p_code, data)
# print(code)
# print(len(table))
# print(len(code))
# print(table['股票名称'])
table['股票代码'] = code

# 通过concat()函数将各页的表格纵向拼接成一个总的DataFrame
data_all = pd.concat([data_all, table], join='outer', ignore_index=True)

data_all.to_excel('分析师评级报告.xlsx', index=False)

访问网页并获取网页源代码

url = 'http://yanbao.stock.hexun.com/ybsj.aspx?type=5'
browser.get(url)
data = browser.page_source

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
吃鸡王者 2020-04-07 17:12
关注
data.columns=data.iloc[0].values
data=data.drop(0)
data=data.reset_index(drop=True)

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 8
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

将DataFrame的索引列转换为数据列并自定义转换后的列名是一个常见的操作，可以使用pandas库中的reset_index函数实现
2023-09-05 02:41

独行侠WU的博客将DataFrame的索引列转换为数据列并自定义转换后的列名是一个常见的操作，可以使用pandas库中的reset_index函数实现。上述代码将创建一个包含姓名、年龄和城市的DataFrame，并将"Name"列设置为索引列。通过上述代码...
数据处理与统计分析——05-Pandas中DataFrame的方法、属性、索引等一系列操作
2024-11-18 22:07

零光速的博客方法是用于创建一个 Pandas DataFrame 的函数。DataFrame 是 Pandas 中的核心数据结构，类似于 Excel 中的二维表格。它。
pandas使用dataframe的索引和数据列同时对dataframe数据进行排序、使用by参数指定排序参数列表、第一个字段进行排序接着对第二个字段进行排序（默认升序）
2022-09-07 08:50

statistics.insight的博客 pandas使用dataframe的索引和数据列同时对dataframe数据进行排序、使用by参数指定排序参数列表、第一个字段进行排序接着对第二个字段进行排序（默认升序）
pandas使用read_excel函数读取excel表格数据为dataframe、设置sheet_name参数为表单索引位置列表则读取多个表单的数据并返回dataframe字典
2022-12-20 08:40

statistics.insight的博客 pandas使用read_excel函数读取excel表格数据为dataframe、使用sheet_name参数指定读取excel表格中指定的sheet表单、设置sheet_name参数为表单索引位置列表则读取多个表单的数据并返回dataframe字典
pandas使用duplicated函数删除dataframe中重复列名称的数据列、默认保留重复数据列中的第一个数据列(removing duplicate columns in dataframe)
2022-02-28 07:10

Data+Science+Insight的博客 pandas使用duplicated函数删除dataframe中重复列名称的数据列、默认保留重复数据列中的第一个数据列(removing duplicate columns in dataframe)
pandas读取csv数据、index_col参数指定作为行索引的数据列索引列表形成复合（多层）行索引、使用方括号[]基于行层索引最外侧索引的范围筛选dataframe数据（指定起始索引和结束索引）
2023-01-27 17:23

Data+Science+Insight的博客 col参数指定作为行索引的数据列索引列表形成复合（多层）行索引、header参数指定作为列索引的行索引列表形成复合（多层）列索引、使用方括号[]基于行层索引最外侧索引的范围筛选dataframe数据（指定起始索引和结束...
pandas读取csv数据、参数指定作为行索引的数据列索引列表形成复合（多层）行索引、使用iloc基于行索引位置范围和列索引位置范围筛选dataframe数据（指定起始位置和结束位置)
2023-05-25 23:12

Data+Science+Insight的博客 col参数指定作为行索引的数据列索引列表形成复合（多层）行索引、header参数指定作为列索引的行索引列表形成复合（多层）列索引、使用iloc基于行索引位置范围和列索引位置范围筛选dataframe数据（指定起始位置和结束...
pandas读取csv数据、index_col参数指定作为行索引的数据列索引列表形成复合（多层）行索引、sort_index函数基于多层行索引对dataframe数据排序（默认升序排序）
2023-03-05 10:24

Data+Science+Insight的博客 pandas使用read_csv函数读取csv数据、index_col参数指定作为行索引的数据列索引列表形成复合（多层）行索引、sort_index函数基于多层行索引对dataframe数据排序（默认升序排序）
pandas读取csv数据、header参数指定作为列索引的行索引列表形成复合（多层）列索引、使用set_index函数把数据列转化为行索引（keys参数指定需要被转化的层列索引）
2022-12-24 09:25

Data+Science+Insight的博客 csv函数读取csv数据、index_col参数指定作为行索引的数据列索引列表形成复合（多层）行索引、header参数指定作为列索引的行索引列表形成复合（多层）列索引、使用set_index函数把数据列转化为行索引（keys参数指定...
pandas使用drop_duplicates函数删除dataframe数据中重复的数据行（默认保存重复数据行中第一次出现的数据行）
2023-08-02 08:53

statistics.insight的博客 pandas使用drop_duplicates函数删除dataframe数据中重复的数据行（默认保存重复数据行中第一次出现的数据行）
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
提问应符合社区要求 3月4日