weixin_42059102 2020-08-30 21:44 采纳率: 0%
浏览 77
已结题

求助交叉熵的定义中,“按照真实分布p来衡量识别一个样本的所需要的编码长度”是什么意思?

如题,求助~我看到“https://blog.csdn.net/FrankieHello/article/details/80613952”中说:

现有关于样本集的2个概率分布p和q,其中p为真实分布,q非真实分布。按照真实分布p来衡量识别一个样本的所需要的编码长度的期望(即平均编码长度)为:

图片说明

怎么分布还分真实分布和非真实分布呢? 还有就是,“按照真实分布p来衡量识别一个样本”是什么意思?分布就是分布呗,还有“按照分布来识别样本”的作用?很奇怪呀~

  • 写回答

2条回答 默认 最新

  • threenewbee 2020-08-30 22:02
    关注

    p表示真实分布,q表示p的拟合分布(所谓非真实分布只是一种不规范的说法)
    识别一个样本的所需要的编码长度,在分类算法中你可以理解为log以2为底,分类个数 bit。比如说对手写数字0~9编码,至少需要4bit

    评论

报告相同问题?

悬赏问题

  • ¥15 ROS Turtlebot3 多机协同自主探索环境时遇到的多机任务分配问题,explore节点
  • ¥15 Matlab怎么求解含参的二重积分?
  • ¥15 苹果手机突然连不上wifi了?
  • ¥15 cgictest.cgi文件无法访问
  • ¥20 删除和修改功能无法调用
  • ¥15 kafka topic 所有分副本数修改
  • ¥15 小程序中fit格式等运动数据文件怎样实现可视化?(包含心率信息))
  • ¥15 如何利用mmdetection3d中的get_flops.py文件计算fcos3d方法的flops?
  • ¥40 串口调试助手打开串口后,keil5的代码就停止了
  • ¥15 电脑最近经常蓝屏,求大家看看哪的问题