知识库

记录点点滴滴

论文精读 | YouTubeNet 2016

论文:《Deep Neural Networks for YouTube Recommendations》

原文链接:https://www.sci-hub.shop/10.1145/2959100.2959190

简介:

YouTube整个推荐系统由两个神经网络组成:第一个神经网络用于生成候选(从百万量级的视频库中筛选出几百个候选视频),第二个神经网络用于排名

候选生成网络仅通过协同过滤提供广泛的个性化

广泛使用总体指标(精度、召回率、排名损失)来指导系统的迭代改进,在现场实验中,通过衡量点击率、观看时间以及许多其他衡量用户参与度的指标的细微变化。

启发与思考:

  1. example age(表征意义不明,日志获取到训练开始的时间间隔?)作为的平方作为特征输入,引入了特征的非线性。
  2. 在优化目标的时候,采用每次曝光预期播放时间作为label,而不采用传统的CTR或者播放率。因为预期播放时间更能够体现出用户的兴趣。在目前广告召回场景下,召回的目标最直白的是根据用户的历史信息召回在精排中排top的。
  3. 视频的历史观看以及搜索记录都是相同的加权取平均embedding,抛弃了时间的信息。不以时间建模,用户体验相对较好。
  4. 在提取特征时,为了避免样本不平衡现象,即活跃用户对模型的贡献远大于不活跃用户,对每个用户等量采样
  5. video embedding为离线训练好的,类似于word2vec。而user embedding是根据用户的行为实时生成的
  6. 在embedding匹配计算时,采用了最近邻索引,比一个个匹配速度有明显提升

《论文精读 | YouTubeNet 2016》

点赞

发表评论

邮箱地址不会被公开。 必填项已用*标注