他与星辰皆失 2021-10-29 16:21 采纳率: 80%
浏览 19
已结题

python 正则删除td标签下的p标签,但是保留文字

目的就是删除表格中的p标签,但是保留文本,表格外的p标签不变

<table border="0" cellpadding="0" >
        <tbody>
            <tr style="height:30px;">
                <td style="width:43.04%;border:solid black 1.0pt;">
                    <p align="center" style="text-align:center;line-height:150%;layout-grid-mode:char;">简要技术</p> 
                </td>
                <td style="width:9.76%;border:solid black 1.0pt;border-left:none;padding:0cm 5.4pt 0cm 5.4pt;height:30px;">
                    <p>进口</p>
                </td>
            </tr>
        </tbody>
</table>
<p>dfsdf</p>
<p>sfsdfds</p>

变为

<table border="0" cellpadding="0" >
        <tbody>
            <tr style="height:30px;">
                <td style="width:43.04%;border:solid black 1.0pt;">
                        简要技术
                </td>
                <td style="width:9.76%;border:solid black 1.0pt;border-left:none;padding:0cm 5.4pt 0cm 5.4pt;height:30px;">
                    进口
                </td>
            </tr>
        </tbody>
</table>
<p>dfsdf</p>
<p>sfsdfds</p>

  • 写回答

1条回答 默认 最新

  • 於黾 2021-10-29 16:25
    关注

    这不是正则干的活,你需要html解释器,然后递归一层一层进入里面,去标签

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 11月6日
  • 已采纳回答 10月29日
  • 创建了问题 10月29日