想实现找到pdf中的印章字样，然后在印章字样上插入一个图片，并设置图片浮于文字上方

当前不能找到到印章字样
经查，读取pdf得到的字样为如下：
{
标
准
}
{
项
目
}
{
细
则
}
印
章
所以只能查找到印或章字样，且找到后图片没有浮于文字上方

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.pdmodel.PDPage;
import org.apache.pdfbox.pdmodel.PDPageContentStream;
import org.apache.pdfbox.pdmodel.common.PDRectangle;
import org.apache.pdfbox.pdmodel.graphics.image.PDImageXObject;
import org.apache.pdfbox.text.PDFTextStripper;
import org.apache.pdfbox.text.TextPosition;

import java.io.File;
import java.io.IOException;
import java.util.List;
public class pdfyinzhang {
    private static final String SEARCH_TEXT = "章"; // 搜索的关键字
    private static final float IMAGE_WIDTH = 50; // 图片宽度，单位为点
    private static final float IMAGE_HEIGHT = 50; // 图片高度，单位为点
    private static final String IMAGE_PATH = "d:\\index.gif"; // 图片文件路径
    private static final float IMAGE_XOFFSET = -5; // 图片X偏移量，单位为点
    private static final float IMAGE_YOFFSET = -5; // 图片Y偏移量，单位为点
    public static void main(String[] args) throws IOException {
        // 读取PDF文件
        PDDocument pdfDocument = PDDocument.load(new File("d:\\input.pdf"));
        try {
            // 遍历所有页面
            for (int i = 0; i < pdfDocument.getNumberOfPages(); i++) {
                PDPage page = pdfDocument.getPage(i);

                // 获取页面大小
                PDRectangle pageSize = page.getMediaBox();
                float pageWidth = pageSize.getWidth();
                float pageHeight = pageSize.getHeight();
                // 搜索关键字
                PDFTextStripper stripper = new PDFTextStripper() {
                    @Override
                    protected void writeString(String text, List<TextPosition> textPositions) throws IOException {
                        super.writeString(text, textPositions);
                        for (TextPosition textPosition : textPositions) {
                            String textChunk = textPosition.getUnicode();
                            System.out.println(textChunk);
                            if (textChunk.contains(SEARCH_TEXT)) {
                                System.out.println("找到关键字");
                                // 找到关键字位置后添加图片印章
                                PDImageXObject image = PDImageXObject.createFromFile(IMAGE_PATH, pdfDocument);
                                PDPageContentStream contentStream = new PDPageContentStream(pdfDocument, page, PDPageContentStream.AppendMode.APPEND, true);
                                float x = pageWidth - textPosition.getX() + IMAGE_XOFFSET;
                                float y = pageHeight - textPosition.getY() + IMAGE_YOFFSET;
                                contentStream.drawImage(image, x, y, IMAGE_WIDTH, IMAGE_HEIGHT);
                                contentStream.close();
                            }
                        }
                    }
                };
                stripper.setStartPage(i + 1);
                stripper.setEndPage(i + 1);
                stripper.getText(pdfDocument);
            }
            // 保存修改后的PDF文件
            pdfDocument.save("d:\\inputnewPdf.pdf");
        } finally {
            pdfDocument.close();
        }
    }
}

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2023-11-29 22:38
关注
【相关推荐】

这篇文章：浏览器打印出完整的知乎文章为PDF文件也许能够解决你的问题，你可以看下
除此之外, 这篇博客: PDF电子签章，用鼠标拖动印章到指定的位置，一种在网页PDF中电子签章定位方法中的 三、解决思路 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

这个问题困扰我一周，网上各种资料翻了个遍，都没有解决方案，实在没办法，读了pdf.js 的源码，了解在不同分辨率下，坐标的转换，有了以下思路。

1、在html中，<iframe id='pdffile' src="" name="mainFrame" frameborder="1" width="100%" height="100%" scrolling="auto" noresize="noresize"> </iframe> 用来显示pdf文件，然后利用 viewer.html?file= + encodeURIComponent(src1); 的方式加载文件，这个可以去参考其他文章。

2、在js里，取得viewer里PDFviewer的宽度和高度，注意一下，这个高度是pdf文件的合计高度，比如PDF有10页，高度为7000，那么用这个高度除以总页数，就是每页在浏览器显示的高度了，这个数值是浏览器的坐标体系。方法很简单：

var iFrame = document.getElementById('pdffile');

PagesCount = $.session.get("PagesCount");//总页数

viewerContainer = iFrame.contentDocument.getElementById('viewer');

var previewheight = $(viewerContainer).height();
var previewwidth = $(viewerContainer).width();

previewheight = previewheight / PagesCount；

3、在viewer.js里，取pdf文档每页的宽度 pagewidth和高度pagehight，这个数值是pdf的坐标体系。这个需要viewer.js里取，然后传回到自己的js里。目的是点击pdf时，取点击页的宽度和高度，用来计算。

4、进行坐标转换计算，鼠标点击后，取得鼠标点击坐标。利用Pageheight / previewheight 计算出一个缩放比例，那么

pdf的X坐标 = 鼠标点击的坐标(positionX) * 缩放比例就可以了.当然要考虑超出pdf文档的范围,这个自己考虑下就好了，就是判断鼠标位置是否超出了pdf文档的宽度。

var targetX = positionX * ( Pageheight / previewheight )

pdf的Y坐标就比较麻烦了，因为在pdf里，（0，0）是左下角，鼠标点击在网页时，(0,0）是左上角。所以 pdf的Y坐标的计算方法：

var mousepage = Math.ceil(positionY/previewheight);//判断点击了第几页

var mouse_page_y = previewheight * mousepage - positionY;//转换成点击pdf页的高度

var targetY = mouse_page_y * ( Pageheight / previewheight ) - dragImageHeight （dragImageHeight是图章的高度）

还有点小问题就是如果把鼠标样式变成图章形状（圆形的），点击位置和显示位置有点微小差别，需要微调一下就好。

至此大概的解决办法就完成了。

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(2条)

报告相同问题？

关注问题

获取pdf文件文字图片内容以及在PDF中插入图片
2024-12-09 09:13

yzcn2013的博客【代码】获取pdf文件文字图片内容以及在PDF中插入图片。
java 插入图片章_Java 处理PDF图章（印章）——图片图章、动态图章
2021-03-15 12:47

物联网_赵伟杰的博客图章(印章)是一种在合同、票据、公文等文件中表明法律效应、部门机关权威的重要指示物，常见于各种格式的文件、文档中。对于纸质文档可以手动盖章，但对于电子文档，则需要通过特定的方法来实现。本篇文档分享通过...
Java 添加PDF印章——图片印章、动态印章
2019-07-03 11:43

Eiceblue的博客图章（印章）是一种在合同、票据、公文等文件中表明法律效应、部门机关权威的重要指示物，常见于各种格式的文件、文档中。对于纸质文档可以手动盖章，但对于电子文档，则需要通过特定的方法来实现。本篇文档分享通过...
java poi 读取 word图片_Java Poi 根据文字内容插入 word 图片-Go语言中文社区
2021-02-28 07:42

啧吖的博客需求描述如下图，我需要在word里根据一个图片的名字，将名字替换成该图片(公章)思路：用POI遍历每一个表格里的每一行的每一个单元格，如果遇到我自己定义的"&章",则获取后面的图片的名字，然后利用POI的XWPFRun....
java 位图印章_Java 处理PDF图章（印章）——图片图章、动态图章
2021-02-26 16:42

走路带风的何小璐的博客图章(印章)是一种在合同、票据、公文等文件中表明法律效应、部门机关权威的重要指示物，常见于各种格式的文件、文档中。对于纸质文档可以手动盖章，但对于电子文档，则需要通过特定的方法来实现。本篇文档分享通过...
java修改图章图片_Java 处理PDF图章（印章）——图片图章、动态图章
2021-02-28 18:44

weixin_39517520的博客图章(印章)是一种在合同、票据、公文等文件中表明法律效应、部门机关权威的重要指示物，常见于各种格式的文件、文档中。对于纸质文档可以手动盖章，但对于电子文档，则需要通过特定的方法来实现。本篇文档将分享通过...
Java 处理PDF图章（印章）——图片图章、动态图章
2022-04-20 20:29

Lydia Bess的博客图章（印章）是一种在合同、票据、公文等文件中表明法律效应、部门机关权威的重要指示...即加载PDF文档，并在动态的添加印章内容，包括印章字样、日期、时间、经办人、组织名称等。使用工具：Free Spire.PDF for Java
印章识别技术：通过精准提取印章文字内容，成为提升合同管理效率的关键
2025-11-24 18:17

智能图像文字识别OCR的博客摘要：印章识别技术通过精准提取印章文字内容，成为提升合同管理效率的关键。该技术利用OCR和深度学习，将印章图像转化为结构化文本，实现自动归档、智能审批和合规检查等应用场景。相比复杂防伪技术，印章识别更...
实例讲解Java处理PDF图章的方法
2020-08-26 08:49

添加动态图章需要加载PDF文档，并在动态的添加印章内容，包括印章字样、日期、时间、经办人、组织名称等。以下是添加动态图章的代码： ```java import com.spire.pdf.PdfDocument; import ...
HTML5 Canvas画印章
2019-08-05 01:30

4. **文本与字体**：使用`fillText`或`strokeText`方法在画布上添加文本，如印章中的“公章”字样。可以通过调整字体样式来达到传统印章的效果。 ```javascript ctx.font = 'bold 20px 宋体'; // 设置字体 ctx....
基于springboot的spire.pdf添加印章
2022-09-16 15:03

高级盘丝洞的博客本篇随笔介绍如何在在Winform程序中使用Spire.Pdf实现页面添加印章处理，解决这一痛处。下面我使用springboot利用spire.pdf添加印章。我们先弄一个透明的图章： pom.xml如下： 4.0.0 org.springframework.boot ...
Word文档添加个性印章的制作方法步骤.docx
2021-09-27 04:37

4. 设置图章与正文的层次关系：在弹出的窗口中选“版式”项，将环绕方式改为“浮于文字上方”（后盖章的效果）或者“衬于文字下方”（先盖章的效果）。五、注意事项 1. 软件使用限制：该软件只限于正当场合下的...
印章管理制度...doc
2022-02-22 15:19

- 存放：存放在保险柜中，并建立印章使用登记表。 #### 三、印章的管理 1. **印章保管**： - 法人章：由集团档案室专人保管。 - 公司章及合同章：实行双人双锁管理。 - 财务专用章：由公司档案室统一保管。 -...
spire.pdf-4.7.8.jar
2021-07-30 12:47

图章（印章）是一种在合同、票据、公文等文件中表明法律效应、部门机关权威的重要指示物，常见于各种格式的文件、文档中。...即加载PDF文档，并在动态的添加印章内容，包括印章字样、日期、时间、经办人、组织名称等。
spire.pdf-4.1.2.jar
2021-07-30 12:48

图章（印章）是一种在合同、票据、公文等文件中表明法律效应、部门机关权威的重要指示物，常见于各种格式的文件、文档中。...即加载PDF文档，并在动态的添加印章内容，包括印章字样、日期、时间、经办人、组织名称等。
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 12月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 12月15日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 11月28日

想实现找到pdf中的印章字样，然后在印章字样上插入一个图片，并设置图片浮于文字上方

3条回答 默认 最新

问题事件

3条回答默认最新