m0_61799349 2021-11-16 16:41 采纳率: 0%
浏览 18
已结题

不懂,求帮助朴素贝叶斯问题

数据集


编号,色泽,根蒂,敲声,纹理,脐部,触感,密度,含糖率,好瓜
1,青绿,蜷缩,浊响,清晰,凹陷,硬滑,0.697,0.460,1
2,乌黑,蜷缩,沉闷,清晰,凹陷,硬滑,0.774,0.376,1
3,乌黑,蜷缩,浊响,清晰,凹陷,硬滑,0.634,0.264,1
4,青绿,蜷缩,沉闷,清晰,凹陷,硬滑,0.608,0.318,1
5,浅白,蜷缩,浊响,清晰,凹陷,硬滑,0.556,0.215,1
6,青绿,稍蜷,浊响,清晰,稍凹,软粘,0.403,0.237,1
7,乌黑,稍蜷,浊响,稍糊,稍凹,软粘,0.481,0.149,1
8,乌黑,稍蜷,浊响,清晰,稍凹,硬滑,0.437,0.211,1
9,乌黑,稍蜷,沉闷,稍糊,稍凹,硬滑,0.666,0.091,否
10,青绿,硬挺,清脆,清晰,平坦,软粘,0.243,0.267,否
11,浅白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否
12,浅白,蜷缩,浊响,模糊,平坦,软粘,0.343,0.099,否
13,青绿,稍蜷,浊响,稍糊,凹陷,硬滑,0.639,0.161,否
14,浅白,稍蜷,沉闷,稍糊,凹陷,硬滑,0.657,0.198,否
15,乌黑,稍蜷,浊响,清晰,稍凹,软粘,0.36,0.370,否
16,浅白,蜷缩,浊响,模糊,平坦,硬滑,0.593,0.042,否
17,青绿,蜷缩,沉闷,稍糊,稍凹,硬滑,0.719,0.103,否
import pandas as pd

def readfile():
    datasets = pd.read_csv(r'test.csv', encoding='utf-8')
    del datasets['编号']
    del datasets['好瓜']
    return datasets

def NaiveBayes(test):
    data = readfile()
    data = data.values.tolist()
    goodMelon = [];badMelon = []
    for i in range(len(data)):
        if data[i][9] == 1:
            goodMelon.append(data[i])
        else:
            badMelon.append(data[i])
    # 计算p(x|C1)=p1与p(x|C2)=p2
    p1 = 1.0;p2 = 1.0
    for j in range(len(test)):
        x=0.0
        for k in range(len(goodMelon)):
            if goodMelon[k][j] == test[j]:
                x = x + 1.0
        p1 = p1 * ((x + 1.0) / (len(goodMelon) + 2.0))  # 拉普拉斯平滑
    for j in range(len(test)):
        x=0.0
        for k in range(len(badMelon)):
            if badMelon[k][j] == test[j]:
                x = x + 1.0
        p2 = p2 * ((x + 1.0) / (len(badMelon) + 2.0))  # 拉普拉斯平滑
    pc1 = len(goodMelon) / len(data)
    pc2 = 1 - pc1
    #贝叶斯公式
    p_good = p1*pc1;p_bad=p2*pc2
    if p_good > p_bad:
        print('好瓜')
    else:
        print('坏瓜')

if __name__ == '__main__':
    test=['青绿','蜷缩','浊响','清晰','凹陷','硬滑',0.697,0.460]
    NaiveBayes(test)

img


老是出现这样的报错,

img

  • 写回答

0条回答 默认 最新

    报告相同问题?

    问题事件

    • 系统已结题 11月24日
    • 创建了问题 11月16日

    悬赏问题

    • ¥15 preLaunchTask"C/C++: aarch64- apple-darwin22-g++-14 生成活动 文件”已终止,退出代码为-1。
    • ¥18 关于#贝叶斯概率#的问题:这篇文章中利用em算法求出了对数似然值作为概率表参数,然后进行概率表计算,这个概率表是怎样计算的呀
    • ¥20 C#上传XML格式数据
    • ¥15 elementui上传结合oss接口断点续传,现在只差停止上传和继续上传,各大精英看下
    • ¥100 单片机hardfaulr
    • ¥20 手机截图相片分辨率降低一半
    • ¥50 求一段sql语句,遇到小难题了,可以50米解决
    • ¥15 速求,对多种商品的购买力优化问题(用遗传算法、枚举法、粒子群算法、模拟退火算法等方法求解)
    • ¥100 速求!商品购买力最优化问题(用遗传算法求解,给出python代码)
    • ¥15 虚拟机检测,可以是封装好的DLL,可付费