Python识别判断一句话里的关键字，随后合并为格式文档，怎么实现？

首先是，我们对程序输入一段文字，文字中包含很多关键字，且关键字一般不会重复，而且有优先级
这里进行举例：给我算个沪A123458的价格，续保的
关键字库有分类
A类：续保，续个保，续保的，上年人保，续
B类：转保，转保的，上年其他公司
C类：算价，算个价，给个价格，

文字识别的逻辑是，先识别一段文字中的车牌，一段文字中有且只有一个车牌，而且车牌的规则是一个前缀，后续一个字母，然后5或6个字母或数字，这里有个重要点，这段文字里车牌后不会有干扰性的字母或数字，例如，车牌沪A123456续保，这里的车牌就是沪A123456而不是沪A12345

文字识别后，我的想法是，识别完成后，将已识别的文字删除，继续识别剩下的文字

另外，识别文字得到结果后输出是格式文档，举个例子：给我算个沪A123458的价格，续个保的
识别的结果是：
续保;
某支公司某业务员;
沪A123458;

如果语句中包含A、B、C三大类的语言，只显示A类，且A类统一后为“续保；”
如果语句中包含B、C类，则优先显示B类，且统一为“录单；”
如果语句中只有C类，也是统一为“录单；”

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

听霄 2021-07-23 09:46

关注

没有看到显示某公司某业务员的逻辑


import re

a = {
'A类':('续保','续个保','续保的','上年人保','续'),
'B类':('转保','转保的','上年其他公司'),
'C类':('算价','算个价','给个价格'),
}
b = '给我算个沪A12348的价格，续保的'
c = re.findall('[\u4e00-\u9fa5][A-Z][A-Z\d]{5,6}',b)
print('车牌：',c)
def test(text,result):
    for i in text:
        if i in b:
            return result

if test(a['A类'],'续保') != None:
    print(test(a['A类'],'续保'))
elif test(a['B类'], '转保') != None:
    print(test(a['B类'], '录单'))
elif test(a['C类'], '算价') != None:
    print(test(a['C类'], '录单'))

剩下的就是根据你自己的想法合并到文件里

本回答被题主选为最佳回答 , 对您是否有帮助呢?

报告相同问题？

关注问题

极具参考价值的Python面试题！从创业公司到一线大厂的真实面经汇总
2020-04-21 08:16

吴秋霖的博客全网极具参考价值的Python面试题，从创业公司到一线大厂的面经汇总整理。作者会持续维护更新！
【Python八股文系列】：100个Python的面试/笔试高频考点
2022-09-12 20:09

奋斗的西瓜瓜的博客本文主要整理了关于Python的面试/笔试的一些考点，可用于查漏补缺。
Elasticsearch：Search tutorial - 使用 Python 进行搜索（三）
2024-01-08 17:56

Elastic 中国社区官方博客的博客当具体考虑搜索应用程序时，在向量空间中执行嵌入搜索往往会找到与概念更相关的结果，而不是与搜索提示中输入的确切关键字相关的结果。在本教程的这一部分中，你将学习如何使用免费的机器学习模型生成嵌入，然后你将...
从零开始学Python第05课：分支结构
2023-03-22 08:00

骆昊的技术专栏的博客迄今为止，我们写的 Python 代码都是一条一条语句按顺序向下执行的，这种代码结构叫做顺序结构。然而仅有顺序结构并不能解决所有的问题，比如我们设计一个游戏，游戏第一关的过关条件是玩家获得1000分，那么在第一关...
六万字带你一次性速通python爬虫基础
2022-03-04 21:56

跳探戈的小龙虾的博客网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。...
Python头歌集合（部分参考题解）
2023-11-07 10:11

book大人的博客头歌Python参考题解
多模态RAG实战指南：完整Python代码实现AI同时理解图片、表格和文本
2025-06-10 09:51

大模型研究院的博客传统RAG系统在处理纯文本应用场景中已展现出显著效果，然而现实世界的信息载体往往呈现多模态...文档中普遍包含图像、表格、图表等承载关键信息的视觉元素，这些多模态内容的有效处理正是多模态RAG系统的核心价值所在。
黑马程序员Python+AI大模型零基础到项目实战【python语法笔记篇】
2026-02-26 21:37

最爱虚拟现实的博客黑马程序员Python+AI大模型零基础到项目实战，涵盖Python、Linux、LangChain、Ollama等，从大模型私有化部署到搭建聊天机器人一套通关"【笔记总结1】
2023年Python最新面试题汇总及答案
2022-04-05 22:41

love_521_的博客 1 、什么是Python？为什么它会如此流行？Python是一种解释的、高级的、通用的编程语言。Python的设计理念是通过使用必要的空格与空行，增强代码的可读性。它之所以受欢迎，就是因为它具有简单易用的语法 2 、为什么...
在Python中获取txt文本中特殊字符之间包含关键词的段落脚本
2022-10-10 21:42

修Bug的阿良的博客在Python中获取txt文本中特殊字符之间包含关键词的段落脚本
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 7月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 7月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 7月22日

Python识别判断一句话里的关键字，随后合并为格式文档，怎么实现？

1条回答 默认 最新

问题事件

1条回答默认最新