2 zxc555777 zxc555777 于 2016.04.08 10:39 提问

有人做过多标签文本自动分类吗

主要是多标签文本的预处理与特征表示,算法设计与分析,性能评估。有没有大神有这方面的资料或者代码。

Csdn user default icon
上传中...
上传图片
插入图片
准确详细的回答,更有利于被提问者采纳,从而获得C币。复制、灌水、广告等回答会被删除,是时候展现真正的技术了!
其他相关推荐
文本自动分类
文本自动分类 python
基于机器学习的文本自动分类技术[1]
今天看了一些关于文本信息自动分类的文章,感触颇多。。。。找了一篇觉得不错的文章《Machine Learning in Automated Text Categorization》准备深入学习一下。这是一篇论文,作者是Consiglio Nazionale delle Ricerche, Italy。在学习的同时,做了一下翻译工作:-),以便和我一样对这个感兴趣的人一起学习,研究。。。。翻
【文智背后的奥秘】系列篇——自动文本分类
一.自动文本分类 概述文本分类,顾名思义,就是将一篇文档归为已知类别中的一类或者几个类,为了实现自动分类的目标,通常有以下几个步骤: 构建分类类别体系获取带有类别标签的训练数据训练数据的文本表达及特征选择分类器的选择与训练分类应用数据 给定一篇待分类的文档,若对其进行自动分类,通常需要把文档表达成机器可以处理的数据类型。目前常用的文本表达方式有向量空间模型(VSM),即把文档映射
Python实现文本自动分类(朴素贝叶斯方法)
使用机器学习方法 做文档的自动分类 套路: 1.根据每个文件 生成该文件的一个特征 2.根据特征 选择 分类器 进行文本分类 3.(可选)根据 2 步结果,调整参数/特征等 示例: 数据:搜狗文本分类语料库 精简版 分类器:朴素贝叶斯 编程语言:Python+nltk自然语言处理库+jieba分词库 [python]
教你实现双十一商品标签自动归类(附数据模板)
来源:云栖社区 作者:傲海 本文长度为1280字,建议阅读4分钟 本文为你分享借助PAI平台的文本分析功能,实现一版简单的商品标签自动归类系统。 背景 双十一购物狂欢节刚刚过去,如果是网购老司机,一定清楚通常一件商品会有很多维度的标签来展示,比如一个鞋子,它的商品描述可能会是这样的“韩都少女英伦风系带马丁靴女磨砂真皮厚底休闲短靴”。如果是一个包,那么它的商品描述可能是“天
文本数据的机器学习自动分类方法(上)
随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。以统计理论为基础,利用机器学习算法对已知的训练数据做统计分析从而获得规律,再运用规律对未知数据做预测分析,已成为文本分类领域的主流。InfoQ联合“达观数据“共同策划了《文本数据的机器学习自动分类方法》系列文章,为您详细阐述机器学习文本分类的基本方法与处理流程。
文本数据的机器学习自动分类方法(下)
【编者按】:随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类、组织和管理,已经成为一个具有重要用途的研究课题。而在这些数据中,文本数据又是数量最大的一类。以统计理论为基础,利用机器学习算法对已知的训练数据做统计分析从而获得规律,再运用规律对未知数据做预测分析,已成为文本分类领域的主流。InfoQ联合“达观数据“共同策划了《文本大数据的机器学习自动分类方法》系列文章,为您详细阐述机器学习文本分类的基本方法与处理流程。
【机器学习PAI实践七】文本分析算法实现新闻自动分类
一、背景新闻分类是文本挖掘领域较为常见的场景。目前很多媒体或是内容生产商对于新闻这种文本的分类常常采用人肉打标的方式,消耗了大量的人力资源。本文尝试通过智能的文本挖掘算法对于新闻文本进行分类。无需任何人肉打标,完全由机器智能化实现。本文通过PLDA算法挖掘文章的主题,通过主题权重的聚类,实现新闻自动分类。包括了分词、词型转换、停用词过滤、主题挖掘、聚类等流程。二、数据集介绍具体字段如下: 字
百度网盘文件自动分类sql 并带有对应标识图标
效果:http://wjsou.com/ 文件自动分类sql update file set type='1' where category='-1'; -- 其它云文件 update file set type='3' where category='1'; -- 视频 update file set type='5'  where type='2'; -- 音频 update fil
中文关键词自动分类-----从此解放双手了
论坛大神们搞了很多关键词采集工具,神马易语言的,shell的,python的。发现没有搞了那么多关键词,处理起来真是蛋疼,要么分类去采集,要么采集后分类,还有就是原始数据可能是乱七八糟的。秋夜今天分享一个python脚本实现简易的中文文本自动分类。省不少事。我偷了个懒,没有计算词频,直接提取tf-idf值最高的20个词作为分类依据,当然也可以提取更多词语来分类。 使用请先安装结巴分词。(这样分类