不吃虫汁的少年 2020-04-17 12:13 采纳率: 0%
浏览 5
已结题

如何才能用Java实现以下python代码

import requests
import re
from fontTools.ttLib import TTFont

response = requests.get('https://book.qidian.com/info/1010868264',headers={
'User-Agent':' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.92 Safari/537.36'
})

with open('替换前的网页.html',mode='w',encoding='utf-8') as f:
     f.write(response.text)
html_page = response.text
#字体文件下载地址
font_url = re.findall("; src: url\((.*?)\)format",response.text)[1]

font_response = requests.get(front_url)
with open('字体文件.woff',mode='wb') as f:
    f.write(font_response.content)

fi = TTFont('字体文件.woff')
fi.saveXML('font.xml')

#获取字体映射关系
font_map = fi['cmap'].getBestCamp
print(font_map)

d = {'one':1,'two':2, 'three':3,'four':4,'five':5,'six':6,'seven':7,'eight':8,'nine':9,'zero':0,'period':'.'}
for key in font_map:
      font_map[key] = d[font_map[key]]
print(font_map)

html_page.replace('&#'+str(key)+';',str(font_map[key]))
with open('替换hou的网页.html',mode='w',encoding='utf-8') as f:
     f.write(html_page)

1.下载网页的部分我清楚,重点是如何在Java里修正映射关系和进行替换

  • 写回答

1条回答 默认 最新

  • 超急小霸王 2020-04-17 18:21
    关注

    你正则写错了,?font_url = re.findall("; src: url\('(.*?)'\) format",response)[1]

    评论

报告相同问题?

悬赏问题

  • ¥15 flink cdc无法实时同步mysql数据
  • ¥100 有人会搭建GPT-J-6B框架吗?有偿
  • ¥15 求差集那个函数有问题,有无佬可以解决
  • ¥15 【提问】基于Invest的水源涵养
  • ¥20 微信网友居然可以通过vx号找到我绑的手机号
  • ¥15 寻一个支付宝扫码远程授权登录的软件助手app
  • ¥15 解riccati方程组
  • ¥15 display:none;样式在嵌套结构中的已设置了display样式的元素上不起作用?
  • ¥15 使用rabbitMQ 消息队列作为url源进行多线程爬取时,总有几个url没有处理的问题。
  • ¥15 Ubuntu在安装序列比对软件STAR时出现报错如何解决