如何通过python提取word里面的选择题和填空题

import pandas as pd@
import re
from docx import Document
from collections import OrderedDict

doc = Document("体育.docx")

black_char = re.compile("[\s\u3000\xa0]+")

chinese_nums_rule = re.compile("[一二三四]、(.+?)(")
title_rule = re.compile("\d+.")
option_rule = re.compile("([ABCDEF])")
option_rule_search = re.compile("([ABCDEF])[^(]+")

保存最终的结构化数据

question_type2data = OrderedDict()

从word文档的“一、单项选择题”开始遍历数据

for paragraph in doc.paragraphs[5:]:
# 去除空白字符,将全角字符转半角字符，并给括号之间调整为中间一个空格
line = black_char.sub("", paragraph.text).replace(
"（", "(").replace("）", ")").replace("．", ".").replace("()", "( )")
# 对于空白行就直接跳过
if not line:
continue
if title_rule.match(line):
options = title2options.setdefault(line, [])
elif option_rule.match(line):
options.extend(option_rule_search.findall(line))
else:
chinese_nums_match = chinese_nums_rule.match(line)
if chinese_nums_match:
question_type = chinese_nums_match.group(1)
title2options = question_type2data.setdefault(
question_type, OrderedDict())

result = []
max_options_len = 0
for question_type, title2options in question_type2data.items():
for title, options in title2options.items():
result.append([question_type, title, *options])
options_len = len(options)
if options_len > max_options_len:
max_options_len = options_len
df = pd.DataFrame(result, columns=[
"题型", "题目"]+[f"选项{i}"for i in range(1, max_options_len+1)])

题型可以简化下，去掉选择两个字

df['题型'] = df['题型'].str.replace("选择", "")
df.to_excel("result.xlsx", index=False)

为什么会报错

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
hyh123a 新星创作者: 编程框架技术领域 2022-05-21 17:21
关注
报错信息是什么

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python选择题填空试题
2021-07-10 12:43

- **问题解读**：此题考查的是Python中`list()`函数的用法。当`list()`函数接收到一个字符串参数时，会将该字符串中的每个字符视为独立的元素，并组成一个新的列表返回。 - **解决方案**： - 输入：`'[1,2,3]'`。 ...
教育领域2023济宁中考Python考题解析：涵盖选择题、填空题、编程题与综合题的考试内容规范要求，具体
2025-04-15 18:44

内容概要：本文档为2023年济宁市中考微机Python考试题，涵盖选择题、填空题、编程题和综合题四个部分。选择题主要考察Python基础知识，如函数、数据类型、控制结构等；填空题侧重于表达式的求值和常用函数的应用；...
【Python编程教育】多分支选择结构练习题集：涵盖选择题、填空题及编程实践题目设计
2025-04-14 17:31

内容概要：本文档《Python多分支选择练习题.pdf》主要围绕Python多分支选择结构展开练习，涵盖选择题、填空题、编程题和综合题四个部分。选择题考察了多分支选择结构的关键字、代码逻辑判断、条件表达式的合法性等...
python选择题和填空题_python练习题总结
2020-11-20 23:40

weixin_39728572的博客一、选择题（32分）1、python不支持的数据类型有 AA、charB、intC、floatD、list2. Ex = “foo”y = 2print(x+y)A.foo B.foofoo C.foo2 D.2 E.An exception isthrown3、关于字符串下列说法错误的是 BA、字符应该视为...
【Python编程教育】Python分支嵌套练习题：涵盖选择题、填空题及编程实践的综合训练
2025-04-14 17:32

文档分为四个部分：选择题、填空题、编程题和综合题。选择题部分通过具体代码片段考察学习者对分支嵌套的理解；填空题则要求补全特定条件表达式，强化逻辑思维能力；编程题设计了多个实际应用场景，如三角形类型判断...
大学计算机python选择填空题库及答案.doc
2023-06-13 19:20

以上是针对提供的Python选择填空题库中的知识点的详细解释。这些内容涵盖了Python的基础语法，包括循环、函数、面向对象、模块导入、数学运算、异常处理、数据类型操作以及文件处理等多个方面。理解并掌握这些知识点...
大学计算机python选择填空题库及答案(1).doc
2023-06-13 19:20

在Python编程语言中，有许多核心概念和语法结构。以下是对给定题目中涉及的一些关键知识点的详细解释： 1. `for`循环与`range()`函数：`range()`函数用于生成一系列数字，通常用于循环中。例如`for i in range(1, 5...
python面向对象综合练习：选择题和填空题【附答案】
2025-04-09 10:06

苏婳666的博客在类中，通过双下划线开头的属性（如__name）表示______。抽象类的装饰器需要从abc模块导入______和______。类的静态方法不需要访问______或______。__init__方法的返回值必须是______。多继承时，父类的查找顺序由_...
python选择题和填空题_Python笔记——专项练习习题和答案
2020-11-24 06:55

weixin_39664136的博客 8、通过for循环输出99乘法表 for i in range(1,10): for j in range(1,10): if i>=j: print("%s*%s=%s"%(i,j,i*j),end=" ") print(" ") 9、通过for循环，完成冒泡排序，选择排序 a=[2,5,7,9,5,2] for i in range...
Python基础知识复习题库：判断题与选择填空题详解
2024-10-26 15:45

内容概要：本文档汇总了《Python期末考试题库复习.docx》中的大量练习题，涵盖了判断题和选择填空题。每道题目都附有详细的解答和解析，帮助学生掌握Python的基础知识点。主要包括基本数据类型、字符串、列表、元组...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月5日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月28日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月21日