md文字通过python-markdown库转换后md标记符号仍然存在,但我给原文转成utf8字节码就行了
但是输出是'b"abc"'这种格式的
abc里也同时包含单引号和双引号
我目前是replace去除所有单引号,再把b"换成b',再把整个字符串eval,得到b'abc',再decode
不知道有没有什么更简单的方法
python-markdown库无法正确转换md文字
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
6条回答 默认 最新
关注以下回复引自免费微信小程序:皆我百晓生。 如问题解决,还请采纳。如仍有疑问,请回复留言或私信博主,以便获得更精准的帮助。
在PYTHON中,MARKDOWN是一种常用的文本编辑器支持的语法格式化方式,用于将文档中的内容以特定格式进行处理。然而,如果使用PYTHON来转换MARKDOWN,遇到的问题在于原始的MARKDOWN标签并没有被完全替换掉,而是保留了原来的标签。这导致MARKDOWN中的字符会被转换为UNICODE编码,从而影响到后续的处理过程。因此,需要使用一些技巧或工具来解决这个问题。
首先,确保你的PYTHON环境已经安装了PYTHON MARKDOWN库(通常可以使用PIP INSTALL MARKDOWN命令安装)。然后,在处理MARKDOWN时,使用以下方法可以有效地去除UNICODE编码:
IMPORT MARKDOWN # 使用MARKDOWN包读取MARKDOWN文件 MARKDOWN_FILE = OPEN('YOUR_MARKDOWN_FILE.MD', 'R') MARKDOWN_CONTENT = MARKDOWN.MARKDOWN(MARKDOWN_FILE.READ()) # 使用MARKDOWN包解析并处理MARKDOWN文件 PARSED_CONTENT = MARKDOWN.MARKDOWN(CONTENT=MARKDOWN_CONTENT) # 使用UNICODE编码字符串替换MARKDOWN标签 UNICODE_CONTENT = PARSED_CONTENT.REPLACE('\U{1F600-\U{1F64F}}', '') # 将UNICODE字符串转换回MARKDOWN标签 MARKDOWN_RESULT = MARKDOWN.MARKDOWN(UNICODE_CONTENT)注意:这个方法只适用于处理ASCII码类型的字符,并且可能会导致其他错误。为了更安全地处理UNICODE编码,你可以考虑使用一个第三方库或者编写自己的自定义函数来处理UNICODE编码。
此外,你还可以考虑使用
HTML.PARSER来处理HTML文件中的MARKDOWN数据。但是,这种方法可能不如直接使用PYTHON MARKDOWN库方便。解决 无用评论 打赏 举报