M测试官 2021-02-04 17:10 采纳率: 25%
浏览 38

实现将文本中没有出现 url 且相邻的字符串与其下一个有 url 的字符串拼接在一起,顺序不变返回?

现有一个文本 txt 文件,内容如下:

患有抗核抗体阳性,干燥综合征
现在怀孕 抗核抗体阳性, 已怀孕10周 https://www.haodf.com/kanbing/6483842721.html
一氧化碳中毒 一氧化碳中毒 https://www.haodf.com/kanbing/6484847288.html
脑干出血一个
月零一天 脑干出血
一个月零
一天 https://www.haodf.com/kanbing/6482442757.html
一氧化碳中毒半个月 一氧化碳中毒失眠头晕 https://www.haodf.com/kanbing/6484746310.html

问题:将文本中没有出现 url 且相邻的字符串与其下一个有 url 的字符串拼接在一起,顺序不变返回一个新文件?
pattern = r'https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+/[a-z]{7}/[0-9]+.html'
spo = re.findall(pattern, line, re.S | re.M)

思路:遍历文本字符串,并判断 spo 是否在字符串中,如果没有则加入列表并与下一个 url 的字符拼接在一起,组成一个” 问题 + 空格 + url“格式的文本。
菜鸡了,实在想不出来,有没有大佬帮忙的?

最终完成效果如下:

患有抗核抗体阳性,干燥综合征现在怀孕 抗核抗体阳性, 已怀孕10周 https://www.haodf.com/kanbing/6483842721.html
一氧化碳中毒 一氧化碳中毒 https://www.haodf.com/kanbing/6484847288.html
脑干出血一个月零一天 脑干出血一个月零一天 https://www.haodf.com/kanbing/6482442757.html
一氧化碳中毒半个月 一氧化碳中毒失眠头晕 https://www.haodf.com/kanbing/6484746310.html
  • 写回答

2条回答 默认 最新

  • a1767028198 2021-02-04 17:34
    关注

     

     

    java代码,,最终结果因为字符串拷贝过来有换行,自己去替换换行就行了,py的话就看你有没有这些api了

    评论

报告相同问题?

悬赏问题

  • ¥35 平滑拟合曲线该如何生成
  • ¥100 c语言,请帮蒟蒻写一个题的范例作参考
  • ¥15 名为“Product”的列已属于此 DataTable
  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站
  • ¥50 成都蓉城足球俱乐部小程序抢票
  • ¥15 yolov7训练自己的数据集