随遇而安339 2021-06-14 22:14 采纳率: 66.7%

已采纳

重复性劳动，python 制造工具

请发现自身、同学朋友或父母亲戚的日常学习、工作或生活中的“重复性劳动”，尝试“制造工具”帮助解决问题。

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

小P聊技术 2021-06-14 23:24

关注

python自动化办公：word篇。职场高手不是梦：https://blog.csdn.net/kobeyu652453/article/details/107638171

python自动化办公：excel篇，从此做表不加班：https://blog.csdn.net/kobeyu652453/article/details/107578299

实例：

工具包安装

使用的库：docx
python 没有自带。需要安装。

若运行出现：ModuleNotFoundError: No module named ‘exceptions’

则说明安装失败，需要另外安装

安装方法
先卸载之前安装失败的docx
1、下载 python_docx-0.8.6-py2.py3-none-any.whl 地址： http://www.lfd.uci.edu/~gohlke/pythonlibs/
2、在这个网页的最下边有python_docx-0.8.6-py2.py3-none-any.whl这个安装包，可以CRTL+F 查一下python这个关键字

3、将下载好的.whl文件放到你的工程目录下
4、进入工程目录下，命令行输入pip install python_docx-0.8.6-py2.py3-none-any.whl 重新下载docx包，问题解决。

如图我的anaconda cmd 工程目录是 C:\Users\Shineion

任务场景1

开始编写
业务逻辑

Document 文档
Pargraph段落
run 句子

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# @Author: yudengwu

from docx import Document#负责文档
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT#对齐方式
from docx.shared import Pt#磅数
from docx.oxml .ns import qn #中文格式

import time

price=input("请输入今日价格：")
company_list=['客户1','客户2','客户3','客户4','客户5','客户6','客户7','客户8','客户9']
today=time.strftime('%Y{Y}%m{m}%d{d}',time.localtime()).format(Y='年',m='月',d='日')#把今日事件整理成2020-07-28 %Y %m %d 不能动。-可以变
for i in company_list:
    document=Document()#新建一个文档
    #对整个文档设置字体
    document.styles['Normal'].font.name=u'宋体'# styles['Normal']默认样式
    document.styles['Normal'].element.rPr.rFonts.set(qn('w:eastAsia'),u'宋体')#设置中文字体，这款软件非国人开发，对中文支持差，所以需要这行。
    #设置文档的基础字体
    p1=document.add_paragraph()#加初始化第一个自然段
    p1.alignment=WD_PARAGRAPH_ALIGNMENT.CENTER#居中对齐，默认左对齐
    run1=p1.add_run('关于下达%s产品价格的通知'%(today))#添加内容
    run1.font.name='微软雅黑'#设置标题字体
    run1.element.rPr.rFonts.set(qn('w:eastAsia'), u'微软雅黑')#设置中文格式
    run1.font.size=Pt(21)#设置标题字大小
    run1.font.bold=True#标题加粗
    run1.space_after=Pt(5)#段后距离5磅
    run1.space_before=Pt(5)#距离段前距离5磅

    #第二段 客户称呼
    p2 = document.add_paragraph()  # 加初始化第二个自然段
    run2=p2.add_run(i+": ")#客户称呼
    run2.font.name='仿宋_GB2312'
    run2.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')  # 设置中文格式
    run2.font.size = Pt(15)  # 设置字大小
    run2.font.bold = True  # 加粗

    #第三段 正文
    p3 = document.add_paragraph()  # 加初始化第三个自然段
    run3 = p3.add_run('  根据公式安排，为提供石油优质客户服务，我单位拟定今日石油价格为%s元,特此通知。'%(price))  # 正文
    run3.font.name = '仿宋_GB2312'
    run3.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')  # 设置中文格式
    run3.font.size = Pt(15)  # 设置字大小
    run3.font.bold = True  # 加粗

    #第四段 联系方式
    p4 = document.add_paragraph()  # 加初始化第四个自然段
    p4.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER  # 居中对齐，默认左对齐
    run4=p4.add_run('联系人：余总     电话：1999999999')
    run4.font.name = '仿宋_GB2312'
    run4.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')  # 设置中文格式
    run4.font.size = Pt(15)  # 设置字大小
    run4.font.bold = True  # 加粗
    document.save(r'C:\Users\Shineion\Desktop\测试\%s-价格通知.docx'% i)#使用 客户名+价格通知 命名

结果文件夹

在文档中插入图片和表格

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# @Author: yudengwu

from docx import Document#负责文档
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT#对齐方式
from docx.shared import Pt#磅数
from docx.oxml .ns import qn #中文格式
from docx.shared import Inches#修改图片尺寸

import time
price=input("请输入今日价格：")
company_list=['客户1','客户2','客户3','客户4','客户5','客户6','客户7','客户8','客户9']
today=time.strftime('%Y{Y}%m{m}%d{d}',time.localtime()).format(Y='年',m='月',d='日')#把今日事件整理成2020-07-28 %Y %m %d 不能动。-可以变
for i in company_list:
    document = Document()  # 新建一个文档
    # 对整个文档设置字体
    document.styles['Normal'].font.name = u'微软雅黑'  # styles['Normal']默认样式
    document.styles['Normal'].font.size=Pt(14)
    document.styles['Normal'].element.rPr.rFonts.set(qn('w:eastAsia'), u'微软雅黑')  # 设置中文字体，这款软件非国人开发，对中文支持差，所以需要这行。
    # 设置文档的基础字体

    #加载图片,并修改尺寸
    document.add_picture('图片红头.png',width=Inches(6))
    #第一段内容
    p1 = document.add_paragraph()  # 加初始化第一个自然段
    p1.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER  # 居中对齐，默认左对齐
    run1 = p1.add_run('关于下达%s产品价格的通知' % (today))  # 添加内容
    run1.font.name = '微软雅黑'  # 设置标题字体
    run1.element.rPr.rFonts.set(qn('w:eastAsia'), u'微软雅黑')  # 设置中文格式
    run1.font.size = Pt(21)  # 设置标题字大小
    run1.font.bold = True  # 标题加粗
    run1.space_after = Pt(5)  # 段后距离5磅
    run1.space_before = Pt(5)  # 距离段前距离5磅
    #第二段
    # 第二段 客户称呼
    p2 = document.add_paragraph()  # 加初始化第二个自然段
    run2 = p2.add_run(i + ": ")  # 客户称呼
    run2.font.name = '仿宋_GB2312'
    run2.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')  # 设置中文格式
    run2.font.size = Pt(15)  # 设置字大小
    run2.font.bold = True  # 加粗
    # 第三段 正文
    p3 = document.add_paragraph()  # 加初始化第三个自然段
    run3 = p3.add_run('  根据公式安排，为提供优质客户服务，我单位拟定今日价格如下：。')  # 正文
    run3.font.name = '仿宋_GB2312'
    run3.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')  # 设置中文格式
    run3.font.size = Pt(15)  # 设置字大小
    run3.font.bold = True  # 加粗

    #添加表格
    table=document.add_table(rows=3,cols=3,style='Table Grid')#初始化表格，style为格式，自己查
    table.cell(0,0).merge(table.cell(0,2))#合共单元格，从（0,0） 合共到（0,2） 即第一行合并。选择左上和右下两格位置即可合并
    table_run1=table.cell(0,0).paragraphs[0].add_run('xx产品报价表')#paragraphs[0]这个段落是在表格里面
    table_run1.font.name=u'宋体'
    table_run1.element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')  # 设置中文格式
    table.cell(0, 0).paragraphs[0].alignment=WD_PARAGRAPH_ALIGNMENT.CENTER#第一行居中

    #使用表格默认字体格式来添加内容
    table.cell(1,0).text='日期'
    table.cell(1, 1).text = '价格'
    table.cell(1, 2).text = '备注'
    table.cell(2, 0).text = today
    table.cell(2, 1).text = str(price)
    table.cell(2, 2).text = ' '

    # 第四段 联系方式
    p4 = document.add_paragraph()  # 加初始化第四个自然段
    p4.alignment = WD_PARAGRAPH_ALIGNMENT.CENTER  # 居中对齐，默认左对齐
    run4 = p4.add_run('联系人：余总     电话：1999999999')
    run4.font.name = '仿宋_GB2312'
    run4.element.rPr.rFonts.set(qn('w:eastAsia'), u'仿宋_GB2312')  # 设置中文格式
    run4.font.size = Pt(15)  # 设置字大小
    run4.font.bold = True  # 加粗

    #插入分页符 ，然后在第二页插入广告
    document.add_page_break()#插入分页符
    p5 = document.add_paragraph()  # 加初始化第五个自然段
    run5=p5.add_run('广告所在地')

    document.save(r'C:\Users\Shineion\Desktop\测试\%s-价格通知.docx' % i)  # 使用 客户名+价格通知 命名

第一页

第二页

从word文档中读取内容

读取内容

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# @Author: yudengwu

from docx import Document#负责文档

document=Document(r'C:\Users\Shineion\Desktop\新建 DOCX 文档.docx')#文件路径 文件格式为docx。 doc要出错，问题我不清楚
all_paragraphs=document.paragraphs#所有段落
for paragraph in all_paragraphs:
    print(paragraph.text)

    #不要使用下面的,因为一个段落里可能有多个run,这样会打乱，人很难读
    #for run in paragraph.runs:
        #print(run.text)

读取Word表格里的内容

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# @Author: yudengwu

from docx import Document#负责文档
document=Document(r'C:\Users\Shineion\Desktop\新建 DOCX 文档.docx')#文件路径 文件格式为docx。 doc要出错，问题我不清楚
all_tables=document.tables#获取所有表格
for table in all_tables:
    for row in table.rows:#每一行
        for cell in row.cells:#获取单元格
            print(cell.text)

原文文件：

结果：

读取含有文字和表格的Word

# @Author: yudengwu
import zipfile
word=zipfile.ZipFile(r'C:\Users\Shineion\Desktop\新建 DOCX 文档.docx')
xml=word.read("word/document.xml").decode('utf-8')#读取文档前端页面内容

发现存在文字的部分前面有<w:t> 这个符号

以<w:t> 分割字符

xml_list=xml.split('<w:t>')

以下为正则方法提取文本
正则教程
python :re模块基本用法

text_list=[]
for i in xml_list:
    if i.find('</w:t>')+1:#i.find('<w:t>')值为1和-1，-1为没找到。+1是为了变成0和正数，即true，false
        text_list.append(i[:i.find('</w:t>')])
    else:
        pass
print(text_list)
text="".join(text_list)
print(text)

所有代码;

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# @Author: yudengwu
import zipfile

word=zipfile.ZipFile(r'C:\Users\Shineion\Desktop\新建 DOCX 文档.docx')

xml=word.read("word/document.xml").decode('utf-8')#读取文档前端页面内容

xml_list=xml.split('<w:t>')

text_list=[]
for i in xml_list:
    if i.find('</w:t>')+1:#i.find('<w:t>')值为1和-1，-1为没找到。+1是为了变成0和正数，即true，false
        text_list.append(i[:i.find('</w:t>')])
    else:
        pass
print(text_list)

word格式套用：创造模板

适合快速写短文档
#传统的做法是一段段设置段落,add_run等，如果段落较多，设置一个函数即创造一个模板

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# @Author: yudengwu

from docx import Document#负责文档
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT#对齐方式
from docx.shared import Pt#磅数
from docx.oxml .ns import qn #中文格式


#传统的做法是一段段设置段落,add_run等，如果段落较多，设置一个函数
list=['余总的女朋友','余总的媳妇']
for change in list:
    document = Document()  # 新建一个文档
    # 对整个文档设置默认字体格式
    document.styles['Normal'].font.name = u'黑体'  # styles['Normal']默认样式
    document.styles['Normal'].font.size = Pt(14)
    document.styles['Normal'].element.rPr.rFonts.set(qn('w:eastAsia'), u'黑体')  # 设置中文字体，这款软


    def add_context(context):
        p = document.add_paragraph()  # 初始化一个段落
        p.alignment = WD_PARAGRAPH_ALIGNMENT.LEFT  # 左对齐
        r = p.add_run(str(context))  # 添加文本
        r.font_size = Pt(16)
        p.space_after = Pt(5)  # 段后距离
        p.space_before = Pt(5)  # 段前距离


    add_context('%s回眸一笑百魅生，六宫粉黛无颜色。' % change)#在段首添加文字
    add_context('%s秀色掩今古，荷花羞玉颜。' % change)#在段首添加文字
    add_context('%s俏丽若三春之桃，清素若九秋之菊。' % change)#在段首添加文字
    document.save(r'C:\Users\Shineion\Desktop\测试\%s-古诗.docx' % change)#保存，文件路径

我只写啦三段内容。

结果：

word格式套用：套用模板

适合快速写长的文档，
自己可以先在word里做好模板，
因此不再需要再代码定义文档格式。

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
# @Author: yudengwu

from docx import Document#负责文档
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT#对齐方式
from docx.shared import Pt#磅数
from docx.oxml .ns import qn #中文格式

#导入一个现成的word文档模板
document=Document(r'C:\Users\Shineion\Desktop\新建 DOCX 文档.docx')#使用docx文档吧，doc好像要保错

#替换文字

def change(old_text,new_text):
    all_paragraphs = document.paragraphs  # 所有段落
    for paragraph in all_paragraphs:
        #前文介绍了读取所有内容，如果在paragraph层替换会丢弃格式，所以选择run层
        # 定义到run层，如果结果很乱，需要将原始文档以纯文字形式复制到另一个文档，将另一个文档作为模板.粘贴方式选择只保留文本
        for run in paragraph.runs:
            run_text=run.text.replace(old_text,new_text)#替换
            run.text=run_text
        #如果有表格
        """
        all_tables = document.tables  # 获取所有表格
        for table in all_tables:
            for row in table.rows:  # 每一行
                for cell in row.cells:  # 获取单元格
                    cell_text=cell.text.replace(old_text,new_text)
                    cell.text=cell_text
        """

#文字替换
change('贵州大学','清华大学')
change('2005','2020')
change('2004','2020')

i='清华大学研究生学位论文格式'
document.save(r'C:\Users\Shineion\Desktop\测试\%s.docx'%i)

原始文件暴露学校啦。
博主没本事，读不了名校。

结果：

Word转PDF

她来啦

使用的库 win32com
安装指令 pip install pywin32

遍历一个文件夹，将文件夹的word文档全转换成PDF

这段代码有借鉴他人

from win32com.client import Dispatch
from os import walk

wdFormatPDF = 17


def doc2pdf(input_file):
    word = Dispatch('Word.Application')
    doc = word.Documents.Open(input_file)
    doc.SaveAs(input_file.replace(".docx", ".pdf"), FileFormat=wdFormatPDF)
    doc.Close()
    word.Quit()


if __name__ == "__main__":
    doc_files = []
    directory = "C:\Users\Shineion\Desktop\测试"
    for root, dirs, filenames in walk(directory):
        for file in filenames:
            if file.endswith(".doc") or file.endswith(".docx"):
                doc2pdf(str(root + "\\" + file))

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

重复性劳动，python 制造工具 python
2021-06-14 22:14

回答 1 已采纳 python自动化办公：word篇。职场高手不是梦：https://blog.csdn.net/kobeyu652453/article/details/107638171 python自动化办公：
Python；挑战性；随机数 python
2023-02-22 20:40

回答 1 已采纳该回答内容部分引用GPT，GPT_Pro更好的解决问题 import numpy as np #二维数组，用来存储7个区间的范围 intervals = [[133445, 3344647621]]
python批量处理重复数据的思路请教~ python
2021-09-28 10:49

回答 2 已采纳可以参考以下项目：https://github.com/soda92/python_word_processing
重复代码检测工具：一个简单的Python3工具，用于检测存储库中文件之间的相似性
2021-02-13 07:11

重复代码检测工具一个简单的Python3工具，用于检测存储库中文件之间的相似性。什么？命令行工具，用于接收目录或文件列表，并确定它们之间的相似程度。为什么？该工具旨在指导希望减少组件内代码重复并改善其软件...
用python语言解决字典问题 python
2021-11-28 21:40

回答 1 已采纳 s=input() s2=set(s) if len(s) == len(s2): print('no') else: print('yes')
Python tkinter 事件绑定问题 python
2022-02-12 18:59

回答 2 已采纳库 import xlrdimport tkinter as tkimport ttkbootstrap as ttkfrom docx import *from tkinter import *fr
python 转换json时错误，提示在文中 json python
2021-07-31 23:20

回答 2 已采纳 res = requests.get('https://openapi.cheyun.com/article/41534') json_data = json.loads(res.text)
python利用集合的无重复性_python集合类型用法分析
2020-12-04 00:27

weixin_39799825的博客具体分析如下：python的集合类型和其他语言类似, 是一个无序不重复元素集,我在之前学过的其他的语言好像没有见过这个类型，基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), ...
python3爬虫，用正则怎么把重复标签下的内容分别拿出来？ pycharm python 有问必答爬虫
2021-11-28 09:52

回答 2 已采纳 #使用正则 '<td>(.*)</td>',即可获取所有td标签下的文本内容。 import requests import re url='http://cba.sports
python中怎样实现每循环一次就重新使用def方法一次 python
2020-09-18 10:21

回答 3 已采纳把haoma=Suijihaoma()放在while内部，放在外部只调用一次，放在里面，每次都执行
Python识别判断一句话里的关键字，随后合并为格式文档，怎么实现？ python
2021-07-22 17:06

回答 1 已采纳没有看到显示某公司某业务员的逻辑 import re a = { 'A类':('续保','续个保','续保的','上年人保','续'), 'B类':('转保','转保的','上年其他公司'), '
【python技能树】python简介
2022-04-30 16:20

左手の明天的博客 Python 是一种简单易学并且结合了解释性、编译性、互动性和面向对象的脚本语言。Python提供了高级数据结构，它的语法和动态类型以及解释性使它成为广大开发者的首选编程语言。 Python 是解释型语言：开发过程中...
selenium自动化代码写好之后领导觉得重复代码比较多，想把重复的定位元素写在json中读取 python selenium 可用性测试有问必答
2021-06-24 09:50

回答 3 已采纳去了解一下PO模式，一般是把动作在方法里封装好，再元素定位写在yaml文件里，然后初始化的时候，读取指定的yaml文件，就可以了，你这个写的太冗余了，
Python性能测试工具Locust入门
2022-12-18 19:57

我亲手种的.的博客 2、Jmeter 同样是非常有名的开源性能测试工具，功能也很完善，它可以作为接口测试工具的使用。分布式模式运行，设置 master 节点的端口号，只在与 –slave 节点一起运行时使用，默认为：5557。使用也比较复杂，目前...
python去重复
2023-03-10 21:46

嗷呜大嘴狼的博客但是，由于Python语言的灵活性，有时候我们会在代码中出现重复的部分，这就需要我们进行去重复操作。Python去重复的方法有很多种，其中最常用的是使用set()函数。set()函数可以将一个列表或元组转换成一个集合，集合...
没有解决我的问题, 去提问

悬赏问题

¥30 这是哪个作者做的宝宝起名网站
¥60 版本过低apk如何修改可以兼容新的安卓系统
¥25 由IPR导致的DRIVER_POWER_STATE_FAILURE蓝屏
¥50 有数据，怎么建立模型求影响全要素生产率的因素
¥50 有数据，怎么用matlab求全要素生产率
¥15 TI的insta-spin例程
¥15 完成下列问题完成下列问题
¥15 C#算法问题, 不知道怎么处理这个数据的转换
¥15 YoloV5 第三方库的版本对照问题
¥15 请完成下列相关问题！

码龄粉丝数原力等级 --

重复性劳动，python 制造工具

1条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

重复性劳动，python 制造工具

1条回答 默认 最新

悬赏问题

1条回答默认最新