chuxuezhe7954 2017-11-15 13:51 采纳率: 33.3%
浏览 2721
已结题

机器学习菜鸟求问短文本分类问题

我有一个短文本集,基本上每段都是不超过100字的文本,是关于某个学科的描述。
然后我现在也有相关学科的列表,并且知道每个学科的核心关键词。
现在的任务是需要自动地对这些短文本进行分类,打上相应学科的标签,一般一段文本对应一个学科。

求教大神应该怎么做,越详细越好,包括是否需要人工做标注,用什么算法,怎么训练参数。本人拥有一定的Python编程基础,在数据挖掘和机器学习方面都是刚刚入门的菜鸟知道一定的概念但是懂得不多不深入,切词什么的还是会的。主要就是不知道切完词之后,词序列如何和 学科对应的关键词进行匹配,每个关键词的参数如何训练

我知道关于文本分类、短文本分类都有很多现成的研究,网上也有很多文章,主要是现在时间比较紧急,没有时间一点点地阅读学习,所以希望得到快速的指导,谢谢!

  • 写回答

7条回答 默认 最新

  • gejingpei 2017-11-16 07:11
    关注

    推荐你本书《机器学习实战》Perter Harrington写的那本。我最近也在看,上面会教你怎么准备数据,怎么分析数据、训练算法等。
    你这个问题,可以参考这本书的第四章。

    pdf下载地址:http://download.csdn.net/download/u012491566/6474803

    评论

报告相同问题?

悬赏问题

  • ¥15 关于#python#的问题:求帮写python代码
  • ¥20 MATLAB画图图形出现上下震荡的线条
  • ¥15 LiBeAs的带隙等于0.997eV,计算阴离子的N和P
  • ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘
  • ¥15 来真人,不要ai!matlab有关常微分方程的问题求解决,
  • ¥15 perl MISA分析p3_in脚本出错
  • ¥15 k8s部署jupyterlab,jupyterlab保存不了文件
  • ¥15 ubuntu虚拟机打包apk错误
  • ¥199 rust编程架构设计的方案 有偿
  • ¥15 回答4f系统的像差计算