问题描述:
HTML中的编码串:
HTML源码:&#x开头的编码字符串,爬虫爬下来的是 \u开头的,后四位一样
这个怎么才能获得&#x开头的编码啊?
ps: \u开头的字符串,python认为是一个字符,也就是说他的长度为1,因为需要做字符串替换,替换成uni开头的(后四位不变),用来做大众点评的字体反爬,所以想要获得HTML中的&#x开头的字符串
恳请大佬指点指点!!!!
抓字体文件获得的字典:
爬虫爬下的HTML中的编码:
问题描述:
HTML中的编码串:
HTML源码:&#x开头的编码字符串,爬虫爬下来的是 \u开头的,后四位一样
这个怎么才能获得&#x开头的编码啊?
ps: \u开头的字符串,python认为是一个字符,也就是说他的长度为1,因为需要做字符串替换,替换成uni开头的(后四位不变),用来做大众点评的字体反爬,所以想要获得HTML中的&#x开头的字符串
恳请大佬指点指点!!!!
抓字体文件获得的字典:
爬虫爬下的HTML中的编码: