现在表中有许多数据,大致分为人物、综艺、电影、电视剧、动画不同的类型,现在要对这些数据做相互关联。
人物和电影之类的关联我是从网上抓电影的百科数据,然后用人名去匹配电影里的演员、导演就能发现人和电影之间的关联。
但是我想发现不同电影、电视剧、动画之间的关联如何操作。比如西游记、西游记续集、西游降魔篇、七龙珠它们之间是有联系的,不知道机器能不能做这种关联,还是只能人工做?
现在表中有许多数据,大致分为人物、综艺、电影、电视剧、动画不同的类型,现在要对这些数据做相互关联。
人物和电影之类的关联我是从网上抓电影的百科数据,然后用人名去匹配电影里的演员、导演就能发现人和电影之间的关联。
但是我想发现不同电影、电视剧、动画之间的关联如何操作。比如西游记、西游记续集、西游降魔篇、七龙珠它们之间是有联系的,不知道机器能不能做这种关联,还是只能人工做?
肯定是可以的,举个列子,我写过一个对几百G的数据的新闻做情感分析,用的是大数据,但是关键是算法.像西游记,西游记续集,西游降魔篇、七龙珠这些你可以定义一些keyWord,能对其主题进行很好的识别,然后对关键字进行数据处理,这就很简单了.那么问题来了,怎么定义关键字?这个貌似得人工来,目前再走机器得路的话恭喜你,机器学习你不得不考虑,能够对视频能容目前经行鉴定得还没听过比较成熟得.个人觉得,你可以根据你爬得对电影电视剧得相关介绍,百科什么的进行文本分析就可以了,比如分析两个文本得相关性,这个就和我前面说的那个情感分析很像了.