from sklearn.naive_bayes import MultinomialNB
nb = MultinomialNB()
from sklearn.pipeline import make_pipeline
pipe = make_pipeline(vect, nb)
pipe.fit(X_train.cutted_comment, y_train)
pipe.predict(X_test.cutted_comment)
朴素贝叶斯是分别计算这个文本是差评的概率和是好评的概率,但是如果这两个概率相等该分到哪一类呢?我是基于词袋模型构建的特征词典,比如一个新的文本,文本中没有出现词典中的特征词,但是用拉普拉斯平滑可以算出一个不为零的概率,但是理论上应该好评差评概率相等吧,这个时候应该归在哪一类呢?实现机制是怎么样的?