字典格式如下:
华硕电脑/COM
长扬汽车修理厂/COM
德成商店/COM
欧维思/COM
有家烧烤店/COM
宏峰五金建材商店/COM
兰州拉面/COM
手动太慢了,怎么自动收集这些数据啊?
字典格式如下:
华硕电脑/COM
长扬汽车修理厂/COM
德成商店/COM
欧维思/COM
有家烧烤店/COM
宏峰五金建材商店/COM
兰州拉面/COM
手动太慢了,怎么自动收集这些数据啊?
你的字典是指python里面的dict还是像新华字典的字典?
如果是前者,那你这个格式也不对啊,dict={“华硕电脑”:“com”}这个个是才是字典格式。店铺名是已经有文件了还是只有网站?只有网站的话需要爬虫得到文件,如果只有文件的话那么读取文件写入dict就可以了。
如果你想要建立像新华字典的那种,那你看看jieba这个模块,需要先处理先分词然后做成字典。nlp了解不多,只是知道有这么个东西。