最近在做文本相似度的课设,但是首先得了解一下TF.IDF算法,我在网上找了一圈,也没发现有多少用C#实现这个算法的,有没有老哥擅长这个给个示例代码啊...
非常感谢了!
主要实现功能就是简单计算字符串的TD,IDF就行
例如,S1=ab,S2=ac
利用TF.IDF算法计算出S1里,a:1/2 b:1/2 c0/2
S2里,a:1/2 b:0/2 c1/2
IDF a:lg(2/2) b:lg(2/2) c:lg(2/1)
C#实现,跪求大佬们给个示例
最近在做文本相似度的课设,但是首先得了解一下TF.IDF算法,我在网上找了一圈,也没发现有多少用C#实现这个算法的,有没有老哥擅长这个给个示例代码啊...
非常感谢了!
主要实现功能就是简单计算字符串的TD,IDF就行
例如,S1=ab,S2=ac
利用TF.IDF算法计算出S1里,a:1/2 b:1/2 c0/2
S2里,a:1/2 b:0/2 c1/2
IDF a:lg(2/2) b:lg(2/2) c:lg(2/1)
C#实现,跪求大佬们给个示例