详细介绍这几年AIGC火爆的隐藏功臣,多模态模型:CLIP。
4条回答 默认 最新
好评笔记 2025-01-12 11:27关注CLIP(Contrastive Language-Image Pre-training)
CLIP 的核心思想
CLIP 的模型架构
1 图像编码器
2 文本编码器
3 对比学习机制
4 对比损失(Contrastive Loss)
InfoNCE
图像编码器损失函数
文本编码器损失函数
总损失函数5 共享嵌入空间
CLIP 的训练方式
CLIP 的推理过程
1 图像分类
2 跨模态检索
CLIP 的优势
CLIP 的应用场景
1 零样本学习
2 跨模态检索
3 多模态理解任务
CLIP 的局限性
————————————————版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/haopinglianlian/article/details/145089638
本回答被题主选为最佳回答 , 对您是否有帮助呢?评论 打赏 举报解决 1无用