亲爱的研友该休息了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!身体可是革命的本钱,早点休息,好梦!

Sampling-bias-corrected neural modeling for large corpus item recommendations

计算机科学 词汇 推荐系统 人工神经网络 人工智能 采样(信号处理) 取样偏差 数据清理 机器学习 数据挖掘 情报检索 数据质量 样本量测定 统计 滤波器(信号处理) 语言学 哲学 数学 计算机视觉 经济 公制(单位) 运营管理
作者
Xinyang Yi,Ji Yang,Lichan Hong,Derek Zhiyuan Cheng,Lukasz Heldt,Aditee Kumthekar,Zhe Zhao,Wei Li,Ed H.
出处
期刊:Conference on Recommender Systems 卷期号:: 269-277 被引量:175
标识
DOI:10.1145/3298689.3346996
摘要

Many recommendation systems retrieve and score items from a very large corpus. A common recipe to handle data sparsity and power-law item distribution is to learn item representations from its content features. Apart from many content-aware systems based on matrix factorization, we consider a modeling framework using two-tower neural net, with one of the towers (item tower) encoding a wide variety of item content features. A general recipe of training such two-tower models is to optimize loss functions calculated from in-batch negatives, which are items sampled from a random mini-batch. However, in-batch loss is subject to sampling biases, potentially hurting model performance, particularly in the case of highly skewed distribution. In this paper, we present a novel algorithm for estimating item frequency from streaming data. Through theoretical analysis and simulation, we show that the proposed algorithm can work without requiring fixed item vocabulary, and is capable of producing unbiased estimation and being adaptive to item distribution change. We then apply the sampling-bias-corrected modeling approach to build a large scale neural retrieval system for YouTube recommendations. The system is deployed to retrieve personalized suggestions from a corpus with tens of millions of videos. We demonstrate the effectiveness of sampling-bias correction through offline experiments on two real-world datasets. We also conduct live A/B testings to show that the neural retrieval system leads to improved recommendation quality for YouTube.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
18秒前
神勇不二发布了新的文献求助10
29秒前
会飞的柯基完成签到 ,获得积分10
36秒前
心想柿橙完成签到,获得积分10
37秒前
plusweng完成签到 ,获得积分10
1分钟前
神勇不二完成签到,获得积分10
1分钟前
savesunshine1022完成签到,获得积分10
1分钟前
Arctic完成签到 ,获得积分10
2分钟前
zzhui完成签到,获得积分10
2分钟前
奶黄包完成签到 ,获得积分10
2分钟前
Hello应助陈丹丹采纳,获得10
2分钟前
Side完成签到,获得积分10
3分钟前
啦啦啦发布了新的文献求助50
4分钟前
领导范儿应助哈哈采纳,获得10
4分钟前
4分钟前
哈哈完成签到,获得积分10
4分钟前
哈哈发布了新的文献求助10
4分钟前
斯文败类应助Emon采纳,获得10
4分钟前
5分钟前
啦啦啦发布了新的文献求助10
5分钟前
无与伦比完成签到 ,获得积分0
6分钟前
6分钟前
小马甲应助[刘小婷]采纳,获得10
7分钟前
7分钟前
Emon发布了新的文献求助10
7分钟前
7分钟前
[刘小婷]发布了新的文献求助10
7分钟前
Emon完成签到,获得积分10
7分钟前
害羞孤风完成签到 ,获得积分10
7分钟前
啦啦啦发布了新的文献求助10
8分钟前
标致的满天完成签到 ,获得积分10
8分钟前
Whisper发布了新的文献求助10
8分钟前
小蘑菇应助Omni采纳,获得10
9分钟前
郗妫完成签到,获得积分10
9分钟前
369ninja发布了新的文献求助10
10分钟前
10分钟前
10分钟前
10分钟前
10分钟前
Omni发布了新的文献求助10
10分钟前
高分求助中
Adhesion Science: Principles & Practice 1234
Signals, Systems, and Signal Processing 610
Introduction to Cosmetic Formulation and Technology, 2nd Edition 400
Petrology and Plate Tectonics,2025 400
Burger's Medicinal Chemistry and Drug Discovery 400
Programming for Chemical Engineers Using C, C++, and MATLAB 320
Birth of Twins After Genome Editing for HIV Resistance 300
热门求助领域 (近24小时)
化学 材料科学 医学 生物 纳米技术 工程类 有机化学 化学工程 生物化学 计算机科学 物理 内科学 复合材料 催化作用 物理化学 光电子学 电极 细胞生物学 基因 无机化学
热门帖子
关注 科研通微信公众号,转发送积分 6684471
求助须知:如何正确求助?哪些是违规求助? 8429314
关于积分的说明 18013041
捐赠科研通 5905946
什么是DOI,文献DOI怎么找? 2982462
邀请新用户注册赠送积分活动 1958418
关于科研通互助平台的介绍 1893855