亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Sampling-bias-corrected neural modeling for large corpus item recommendations

计算机科学 词汇 推荐系统 人工神经网络 人工智能 采样(信号处理) 取样偏差 数据清理 机器学习 数据挖掘 情报检索 数据质量 样本量测定 统计 滤波器(信号处理) 语言学 哲学 数学 计算机视觉 经济 公制(单位) 运营管理
作者
Xinyang Yi,Ji Yang,Lichan Hong,Derek Zhiyuan Cheng,Lukasz Heldt,Aditee Kumthekar,Zhe Zhao,Wei Li,Ed H.
出处
期刊:Conference on Recommender Systems 卷期号:: 269-277 被引量:175
标识
DOI:10.1145/3298689.3346996
摘要

Many recommendation systems retrieve and score items from a very large corpus. A common recipe to handle data sparsity and power-law item distribution is to learn item representations from its content features. Apart from many content-aware systems based on matrix factorization, we consider a modeling framework using two-tower neural net, with one of the towers (item tower) encoding a wide variety of item content features. A general recipe of training such two-tower models is to optimize loss functions calculated from in-batch negatives, which are items sampled from a random mini-batch. However, in-batch loss is subject to sampling biases, potentially hurting model performance, particularly in the case of highly skewed distribution. In this paper, we present a novel algorithm for estimating item frequency from streaming data. Through theoretical analysis and simulation, we show that the proposed algorithm can work without requiring fixed item vocabulary, and is capable of producing unbiased estimation and being adaptive to item distribution change. We then apply the sampling-bias-corrected modeling approach to build a large scale neural retrieval system for YouTube recommendations. The system is deployed to retrieve personalized suggestions from a corpus with tens of millions of videos. We demonstrate the effectiveness of sampling-bias correction through offline experiments on two real-world datasets. We also conduct live A/B testings to show that the neural retrieval system leads to improved recommendation quality for YouTube.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
小透明发布了新的文献求助10
12秒前
小透明发布了新的文献求助20
28秒前
Lucas应助大苦瓜采纳,获得10
31秒前
唠叨的绣连完成签到,获得积分10
44秒前
1分钟前
卜哥完成签到 ,获得积分10
1分钟前
酷酷的雨完成签到,获得积分10
1分钟前
NexusExplorer应助科研通管家采纳,获得10
1分钟前
Nina发布了新的文献求助10
1分钟前
大胆的大楚完成签到,获得积分10
2分钟前
2分钟前
大苦瓜发布了新的文献求助10
2分钟前
万能图书馆应助大苦瓜采纳,获得10
2分钟前
Nina完成签到 ,获得积分10
2分钟前
儒雅的月光完成签到,获得积分10
2分钟前
感动萧完成签到,获得积分10
2分钟前
2分钟前
田様应助科研通管家采纳,获得10
3分钟前
3分钟前
闪闪访波完成签到,获得积分10
3分钟前
4分钟前
小透明发布了新的文献求助10
4分钟前
科研通AI6.2应助喂我采纳,获得10
4分钟前
4分钟前
大苦瓜发布了新的文献求助10
4分钟前
yuer完成签到 ,获得积分10
4分钟前
北林完成签到 ,获得积分10
4分钟前
冷傲的怜寒完成签到,获得积分10
4分钟前
予秋发布了新的文献求助10
5分钟前
5分钟前
明亮尔蓝完成签到,获得积分0
5分钟前
朴实的新柔完成签到,获得积分10
6分钟前
6分钟前
lling完成签到 ,获得积分10
6分钟前
顺心的伯云完成签到,获得积分10
7分钟前
星辰大海应助陳.采纳,获得10
7分钟前
Nut完成签到,获得积分10
7分钟前
7分钟前
OsamaKareem应助科研通管家采纳,获得10
7分钟前
7分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Organometallic Chemistry of the Transition Metals 800
Chemistry and Physics of Carbon Volume 18 800
The Organometallic Chemistry of the Transition Metals 800
The formation of Australian attitudes towards China, 1918-1941 640
Signals, Systems, and Signal Processing 610
全相对论原子结构与含时波包动力学的理论研究--清华大学 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6440864
求助须知:如何正确求助?哪些是违规求助? 8254732
关于积分的说明 17571949
捐赠科研通 5499112
什么是DOI,文献DOI怎么找? 2900102
邀请新用户注册赠送积分活动 1876714
关于科研通互助平台的介绍 1716916