最近在研究文本分类的一些内容,遇到了一些难题,希望有缘人能够指点一下关于TF-IDF改进算法的问题,或者有没有其他渠道可以找到算法紧紧的代码,万分感谢!
3条回答 默认 最新
- CSDN专家-黄老师 2021-08-17 21:03关注
参考一下: 一文看懂 TF-IDF (概念图解+4大变种+发展历史) 简单来说,向量空间模型就是希望把查询关键字和文档都表达成向量,然后利用向量之间的运算来进一步表达向量间的关系。比如,一个比较常用的运算就是计算查询关键字所对应的向量和文档所对应的向量之间的 “相关度”。本文还会介绍TF-IDF的变种、历史已经拓展阅读。 https://easyai.tech/ai-definition/tf-idf/
其实你要改变算法,你要从算法的计算过程着手,TF-IDF算法如图你改进算法的话,需要对其公式进行调整,这个要有合理的计算逻辑和验证。如果要提高算法的精度,就要提高数据输入的准确度,比如加强数据清洗规则,使输入的数据更加干净
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决评论 打赏 举报无用 2
悬赏问题
- ¥15 安装opengauss数据库报错
- ¥15 【急】在线问答CNC雕刻机的电子电路与编程
- ¥60 在mc68335芯片上移植ucos ii 的成功工程文件
- ¥15 笔记本外接显示器正常,但是笔记本屏幕黑屏
- ¥15 Python pandas
- ¥15 蓝牙硬件,可以用哪几种方法控制手机点击和滑动
- ¥15 生物医学数据分析。基础课程就v经常唱课程舅成牛逼
- ¥15 云环境云开发云函数对接微信商户中的分账功能
- ¥15 空间转录组CRAD遇到问题
- ¥20 materialstudio计算氢键脚本问题