背景:1.在实际电商或者视频推荐场景中,流行度偏差是肯定存在的,所以所获得的数据集是具有流行度偏差的数据集。2.推荐系统的链路中包括了多个召回模型。3.如果所采用的召回模型不是无偏的话,例如双塔模型,就会被流行度偏差所影响,导致用户表征很相似,召回的内容大都是热门商品或视频,没有个性化。
问题:1.在工业界似乎并不是都采用的去偏的召回模型,那么如果采用的不是去偏的召回模型,工业界通常如何解决这个问题呢?(业界常用的有效的技术)
2.粗排和精排模型也是使用这个数据集,那么也会导致流行度偏差,这个采取什么策略解决呢?
注: 没实际解决过的就不要回答了,国外的chatgpt,国内的大语言模型我都试过了