Power BI 爬網頁資料問題詢問

https://mops.twse.com.tw/nas/t21/sii/t21sc03_112_11_0.html

我如果POWER BI要爬這個網頁資料，因為112代表年分 11代表月份
但當我想要爬出110-112年並且1-12月的資料出來

並且進行合併我該如何做

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
专家-赤兔[在线] 全栈领域优质创作者 2024-05-23 17:54
关注
引自免费微信小程序：皆我百晓生

在Power BI中直接爬取网页数据并不支持动态参数，因此你需要先使用Python或其他编程语言（例如Python）来抓取不同日期范围的数据，然后将这些数据导入到Power BI进行分析。这里是一个基本的步骤指南和Python代码示例来实现这个目标。

首先，确保你已经安装了必要的库，包括requests和BeautifulSoup。如果没有安装，可以使用以下命令安装：

pip install requests beautifulsoup4 pandas

接下来，编写一个Python脚本来抓取每个月的数据，并保存为CSV文件，然后再将这些CSV文件导入到Power BI进行合并分析。这是一个简单的Python脚本示例：

import requests from bs4 import BeautifulSoup import csv import pandas as pd import os # 年份列表 years = [2010, 2011, 2012] # 月份列表 months = range(1, 13) # 创建一个空列表来存储所有数据 all_data = [] for year in years: for month in months: url = f"https://mops.twse.com.tw/nas/t21/sii/t21sc03_{year:04d}_{month:02d}_0.html" response = requests.get(url) if response.status_code == 200: soup = BeautifulSoup(response.text, 'html.parser') table = soup.find('table', attrs={'class': 'table_list'}) rows = table.tbody.find_all('tr') # 处理表头 headers = [th.text.strip() for th in rows[0].find_all('th')] for row in rows[1:]: data = [td.text.strip() for td in row.find_all('td')] all_data.append(data) else: print(f"Failed to fetch data from {url}") # 将数据转换为Pandas DataFrame并保存为CSV df = pd.DataFrame(all_data, columns=headers) df.to_csv("twse_data.csv", index=False) print("Data extraction completed.")

这段代码会创建一个名为twse_data.csv的CSV文件，包含指定年份和月份的所有数据。然后，你可以在Power BI中使用“获取数据”功能，选择“从文件”->“从CSV”，找到这个CSV文件，然后按照提示进行数据加载和合并。

如果你希望在Power BI中直接处理这个CSV文件，可以使用Power Query（也称为“查询编辑器”）。在Power BI Desktop中，点击“主页”选项卡，然后选择“新建查询” -> “从文件” -> “从文本/CSV”。之后，根据向导指示操作，Power BI会自动识别和整理CSV中的数据。

注意：由于网页结构可能会变化，这段代码可能需要根据实际页面布局进行调整。此外，网站可能有反爬虫机制，频繁请求可能会导致IP被封禁。在大规模抓取时，建议添加适当的延迟，或者使用更专业的网络抓取工具，比如Scrapy。
解决无用
评论打赏
分享
举报编辑记录

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

power BI 网页筛选器自动筛选截图 python自动化 python
2023-01-06 23:35

回答 6 已采纳可以使用 Python 库 "pyPowerBI" 来实现这一目标。这个库可以帮助从 Power BI 服务或本地 Power BI 文件中提取数据，并且可以使用 Python 自动化 Power B
Mirsoft Power BI 发布网页全屏后，下方的导航条如何去掉？ android javascript 有问必答
2021-03-12 10:26

回答 2 已采纳题主是想用css把多余部分隐藏吧。Stylish可以做到的。需要找到对应元素的id或者class才行，需要你截个类似这种图才行 css代码，最终效果如下图 .logoBar {
POWER BI 求移动平均的问题数据挖掘
2021-02-21 11:34

回答 3 已采纳研究了两天，今天查阅了一下午的相关文献。总的来说，PowerBI里面有两个重要的概念，一个是列概念，一个是度量值概念，虽然列和度量值都可以使用DAX函数进行求值操作，但是两者所处的上下文是不同的。
Power BI 傻瓜入门 1. 数据分析术语：Power BI风格
2023-10-21 15:43

Martin-Mei的博客了解Power BI可以处理的不同类型的数据了解您的商业智能工具选项熟悉Power BI术语数据无处不在。从你醒来的那一刻到你睡觉的时候，某个系统会代表你收集数据。即使在你睡觉的时候，也会产生与你生活的某些方面...
power bi excel 其他开发语言
2021-06-03 08:54

回答 1 已采纳需要使用SELECTCOLUMNS和UNION 两个函数 SELECTCOLUMNS 函数 (DAX) - DAX | Microsoft Docs UNION 函数 (DAX) - DAX |
power bi 导入时间格式错误怎么处理？数据挖掘有问必答
2021-09-24 13:57

回答 1 已采纳这是字符串格式吧，可以按照字符串格式导入，然后分列，转化为时间格式，求两列的时间间隔。
Power BI内按月份、产品类型每周分类汇总求和 database 需求分析
2022-06-07 17:41

回答 1 已采纳 https://blog.csdn.net/weixin_44790641/article/details/122410250https://blog.csdn.net/weixin_36029647
.NET CoreCLR现在是开源的，因此我通过Microsoft Power BI运行了GitHub存储库
2020-10-10 04:29

cunfusq0176的博客开源bi工具githubThe hits keep on coming, Dear Reader. Just as we announced a few months back, .NET Core is open source. We said it would run on Windows, Mac, and Linux, but then the work of doing it ...
Power BI Service 注册的账号如何具备管理员权限 css 有问必答
2021-03-15 04:12

回答 2 已采纳和你使用的域名相关，详细看一下这个文章 https://zhuanlan.zhihu.com/p/267084365
[Power BI] 根据选择的某值统计表格里行数其他
2023-02-07 23:40

回答 1 已采纳使用以下 DAX 公式计算某一行的行数： IF(选择的行的品类 = "衣服", COUNTIF(表名[品类列], "衣服"), BLANK()) 其中，“选择的行的品类”是您在点击行时存储的选择的行的
power BI连接MySQL数据库失败 mysql sql
2020-07-02 17:19

回答 2 已采纳 https://blog.csdn.net/CheyenneLam/article/details/78553296
数据湖架构、战略和分析的8大错误认知
2021-04-23 00:18

王知无(import_bigdata)的博客数据处理可能发生在Tableau或PowerBi之类的分析工具中，也有可能发生在加载数据到数仓（如Snowflake、Redshift和BigQuery）的应用程序中。与我们合作的一位客户将Adobe事件数据发送到AWS，以支持企业Oracle云环境。...
powerBI列合并 sql
2021-12-23 14:21

回答 1 已采纳添加自定义列或者条件列
tableau大屏bi_Excel，Tableau，Power BI ...您应该使用什么？
2020-08-06 02:16

weixin_26713521的博客 tableau大屏biAfter publishing my previous article on data visualization with Power BI, I received quite a few questions about the abilities of Power BI as opposed to those of Tableau or Excel....
python做bi系统_python开发bi
2020-11-29 10:44

weixin_39907713的博客学习一门编程语言之前，先认识一些相关的工具。这里主要介绍... else语句表达式for 循环break and continue 表达式while 循环作业需求一、python介绍python的创始人为吉多·范罗苏姆（guido van rossum）。 1989年...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月23日

悬赏问题

¥15 35114 SVAC视频验签的问题
¥15 impedancepy
¥15 在虚拟机环境下完成以下，要求截图！
¥15 求往届大挑得奖作品（ppt…）
¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图
¥15 UE5.1局部变量对蓝图不可见

Power BI 爬網頁資料問題詢問

3条回答 默认 最新

问题事件

悬赏问题

3条回答默认最新