爬下来的数据如下图(用python scrapy爬取到mysql)
现在需要对material具体提取其中的食材,修饰词不要。并且去menu形成联系,构成如下图csv关系文件以便导入neo4j
请问如何批量清洗数据?
爬下来的数据如下图(用python scrapy爬取到mysql)
现在需要对material具体提取其中的食材,修饰词不要。并且去menu形成联系,构成如下图csv关系文件以便导入neo4j
请问如何批量清洗数据?
材料看上去都是;分隔的,直接Pyhton连接MySQL读取数据,然后分隔,清洗(正则表达式去掉 g修饰符,清洗时不断加入去掉的关键词)最后写入csv文件。