前沿拓展:
文章轉(zhuǎn)載自**
深度傳送門 , 作者 深度傳送門
導(dǎo)讀:本文是“深度推薦系統(tǒng)”專欄的第七篇文章,這個(gè)系列將介紹在深度學(xué)習(xí)的強(qiáng)力驅(qū)動(dòng)下,給推薦系統(tǒng)工業(yè)界所帶來(lái)的最前沿的變化。本文主要小編綜合來(lái)說(shuō)一下深度推薦系統(tǒng)與CTR預(yù)估2019年值得精讀的論文。 歡迎轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)注明出處以及鏈接,更多關(guān)于深度推薦系統(tǒng)優(yōu)質(zhì)內(nèi)容請(qǐng)關(guān)注如下頻道。知乎專欄:深度推薦系統(tǒng) 微博:深度傳送門 **:深度傳送門
微博上近日流傳一個(gè)段子,“2020年曾是各大科幻片中遙遠(yuǎn)的未來(lái),但是現(xiàn)在離這個(gè)遙遠(yuǎn)的未來(lái)也只有6個(gè)月時(shí)間了”。只是借此感慨一下2019年轉(zhuǎn)瞬之間半年的時(shí)間已經(jīng)過(guò)去了,目前深度學(xué)習(xí)火熱朝天,深度學(xué)習(xí)在推薦系統(tǒng)和CTR預(yù)估工業(yè)界的論文也是一篇接著一篇良莠不齊。
接下來(lái)主要小編綜合來(lái)說(shuō)一下2019年上半年工業(yè)界深度推薦系統(tǒng)與CTR預(yù)估上值得精讀的論文。個(gè)人整理難免遺漏,也歡迎各位同行朋友評(píng)論另外哪些想額外推薦精讀的論文。
1. Top-K Off-Policy Correction for a REINFORCE Recommender System, WSDM 2019, Google
作者:Minmin Chen, Alex Beutel, Paul Covington, Sagar Jain, Francois Belletti, Ed Chi;
論文:t.cn/EUus1wu;Keynote:t.cn/EJFyMBk;
位列首位的當(dāng)屬**推薦強(qiáng)化學(xué)習(xí)的兩篇論文。雖然強(qiáng)化學(xué)習(xí)目前在推薦系統(tǒng)和CTR預(yù)估領(lǐng)域工業(yè)界由于系統(tǒng)復(fù)雜、效果未有顯著提升等眾所周知的原因確實(shí)不夠成熟也尚未大規(guī)模應(yīng)用起來(lái)。但是**推薦的這兩篇論文從某種程度上讓強(qiáng)化學(xué)習(xí)的應(yīng)用方向變得更明確了一些,而且作者在Industry Day上也宣稱線上實(shí)驗(yàn)效果顯示這個(gè)是**單個(gè)項(xiàng)目近兩年來(lái)最大的reward增長(zhǎng),也從某種程度上會(huì)激發(fā)各大公司的研究者們繼續(xù)跟進(jìn)的興趣。
這是第一篇論文,提出了一種Top-K的Off-Policy修正方案將RL中Policy-Gradient類算法得以應(yīng)用在動(dòng)作空間數(shù)以百萬(wàn)計(jì)的**在線推薦系統(tǒng)中。
2. Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology, IJCAI 2019, Google
作者:Eugene Ie, Vihan Jain, Jing Wang, …, Jim McFadden, Tushar Chandra, Craig Boutilier;
論文:t.cn/AiKFHvYU;
這是**推薦應(yīng)用強(qiáng)化學(xué)習(xí)的第二彈,主要貢獻(xiàn)是提出了一種名為SLATEQ的Q-Learning算法,優(yōu)化推薦系統(tǒng)里面同時(shí)展示給用戶多個(gè)item情況的長(zhǎng)期收益LTV(Long-term Value),將長(zhǎng)期收益加入排序多目標(biāo)中進(jìn)行建模優(yōu)化。重點(diǎn)在于與baseline使用的深度網(wǎng)絡(luò)和輸入特征都完全一樣。詳見(jiàn):**推薦已經(jīng)上線RL了,強(qiáng)化學(xué)習(xí)在推薦廣告工業(yè)界大規(guī)模應(yīng)用還遠(yuǎn)嗎?
3. Deep Learning Recommendation Model for Personalization and Recommendation Systems
作者:Maxim Naumov, Dheevatsa Mudigere, Hao-Jun Michael Shi,…, Bill Jia, Liang Xiong, Misha **elyanskiy;
論文:t.cn/Ai0rIUd0;代碼:t.cn/AiNGzCsY;解讀:t.cn/AiOX38PL;
FaceBook推薦最新論文,通過(guò)建模與系統(tǒng)協(xié)同設(shè)計(jì)提出一種butterfly-shuffle的機(jī)制來(lái)提升模型并行化,離線訓(xùn)練上在沒(méi)有任何超參調(diào)優(yōu)下收斂速度與準(zhǔn)確率優(yōu)于DCN,并開(kāi)源了代碼。
4. Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction, WWW 2019, Huawei
作者:Bin Liu, Ruiming Tang, Yingzhi Chen, Jinkai Yu, Huifeng Guo, Yuzhou Zhang;
論文:t.cn/AipAFS3p;
華為 at WWW 2019,提出基于卷積神經(jīng)網(wǎng)絡(luò)的CTR特征生成方法FGCNN,包含特征生成和深度分類器兩部分,可以和任意CTR預(yù)估模型進(jìn)行組合。
5. Deep Spatio-Temporal Neural Networks for Click-Through Rate Prediction, KDD 2019, Alibaba
作者:Wentao Ouyang, Xiuwu Zhang, Li Li, Heng Zou, Xin Xing, Zhaojie Liu, Yanlong Du;
論文:t.cn/Ai0jTY68;代碼:t.cn/Ai0jTY6u;
阿里 at KDD 2019,提出DSTN模型用于點(diǎn)擊率CTR預(yù)估,考慮更多空域與時(shí)域的輔助信息包括上下文展示過(guò)的ad以及歷史點(diǎn)擊/未點(diǎn)擊ad來(lái)更好地預(yù)測(cè)目標(biāo)item的點(diǎn)擊率。從論文實(shí)驗(yàn)數(shù)據(jù)看,效果大幅度超過(guò)DeepFM和GRU,并開(kāi)源了代碼。
6. AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks
作者:Weiping Song, Chence Shi, Zhiping Xiao, Zhijian Duan, Yewen Xu, Ming Zhang, Jian Tang;
論文:t.cn/AipG8aXz;代碼:t.cn/EI8Pnso;
最新的深度CTR預(yù)估模型AutoInt,通過(guò)過(guò)Multi-head注意力機(jī)制將特征投射到多個(gè)子空間中,并在不同的子空間中捕獲不同的特征組合形式,效果超過(guò)xDeepFM等達(dá)到最好。
7. Real-time Attention Based Look-alike Model for Recommender System, KDD 2019, Tencent
作者:Yudan Liu, Kaikai Ge, Xu Zhang, Leyu Lin
論文:t.cn/AiOaAg1Q;解讀:t.cn/AiOaAg1E;
騰訊 at KDD2019,微信看一看團(tuán)隊(duì)對(duì)傳統(tǒng)Look-alike進(jìn)行了改造,提出實(shí)時(shí)Look-alike算法RALM,解決推薦系統(tǒng)多樣性問(wèn)題,效果好于**DNN。
8. Joint Optimization of Tree-based Index and Deep Model for Recommender Systems
作者:Han Zhu, Daqing Chang, Ziru Xu, Pengye Zhang, Xiang Li, Jie He, Han Li, Jian Xu, Kun Gai;
論文:t.cn/AiN5T8Ks;TDM論文:t.cn/RQ5MrSg;
還記得阿里 at KDD 2018的深度樹(shù)匹配召回模型TDM嗎?升級(jí)版JTM提出索引與模型同時(shí)優(yōu)化的方案,大幅提升召回效果。
9. A User-Centered Concept Mining System for Query and Document Understanding at Tencent, KDD 2019, Tencent
作者:Bang Liu, Weidong Guo, Di Niu, Chaoyue Wang, Shunnan Xu, Jinghong Lin, Kunfeng Lai, Yu Xu
論文:t.cn/Ai09Dxkd;解讀:t.cn/Ai09DxkB;數(shù)據(jù)資源:t.cn/Ai09Dxkr;
騰訊 at KDD2019,構(gòu)建了ConcepT概念挖掘標(biāo)記系統(tǒng),利用query搜索點(diǎn)擊日志從用戶視角提取不同的概念,以提高對(duì)短文本(query)和長(zhǎng)文章(document)的理解,從而推動(dòng)推薦,搜索等業(yè)務(wù)的提升。實(shí)驗(yàn)證明,ConcepT在 QQ 瀏覽器信息流業(yè)務(wù)中性能優(yōu)異,曝光效率相對(duì)提升6.01%。
10. Deep Session Interest Network for Click-Through Rate Prediction, IJCAI 2019, Alibaba
作者:Yufei Feng, Fuyu Lv, Weichen Shen, Menghan Wang, Fei Sun, Yu Zhu, Keping Yang;
論文:t.cn/AiN9QZnV;代碼:t.cn/AiN9QZnV;
阿里 at IJCAI2019,考慮到不同用戶行為序列的session內(nèi)行為同構(gòu)與session之間行為異構(gòu)的特性提出了基于sesssion的CTR預(yù)估模型DSIN。使用self-attention機(jī)制抽取session內(nèi)用戶興趣,使用Bi-LSTM針對(duì)用戶跨session興趣進(jìn)行建模。
11. Interaction-aware Factorization Machines for Recommender Systems, AAAI2019, Tencent
作者:Fuxing Hong, Dongbo Huang, Ge Chen;
論文:t.cn/Ai0WHak5;代碼:t.cn/Ai0WHakt;
騰訊 at AAAI2019,提出IFM通過(guò)特征以及特征組不同角度靈活學(xué)習(xí)特征間交互的重要性,并提出了通用的Interation-NN框架和DeepIFM來(lái)捕捉高階交互,效果優(yōu)于DeepFM并開(kāi)源了代碼。
12. Multi-Interest Network with Dynamic Routing for Recommendation at Tmall
作者:Chao Li, Zhiyuan Liu, Mengmeng Wu, …, Qiwei Chen, Wei Li, Dik Lun Lee
論文:t.cn/AiOao6I4;解讀:t.cn/AiOao6I4;
阿里天貓?zhí)岢鯩IND模型通過(guò)Dynamic Routing的方法從用戶行為和用戶屬性信息中動(dòng)態(tài)學(xué)習(xí)出多個(gè)表示用戶興趣的向量,更好的捕捉用戶的多樣興趣,來(lái)提升召回的豐富度和準(zhǔn)確度,效果好于**DNN。
13. Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction, KDD 2019, Alibaba
作者:Qi Pi, Weijie Bian, Guorui Zhou, Xiaoqiang Zhu, Kun Gai;
論文:t.cn/AiN4s4oe;
阿里 at KDD2019,通過(guò)系統(tǒng)設(shè)計(jì)解決用戶超長(zhǎng)行為歷史下CTR建模與在線預(yù)測(cè)性能瓶頸,效果好于GRU4Rec和DIEN。
14. Neural News Recommendation with Long- and Short-term User Representations, ACL 2019, Microsoft
作者:Mingxiao An,F(xiàn)angzhao Wu,Chuhan Wu,Kun Zhang,Zheng Liu,Xing Xie;
論文:t.cn/Ai029G81;
微軟 at ACL 2019,LSTUR用于在**推薦任務(wù)中同時(shí)學(xué)習(xí)用戶長(zhǎng)期和短期的興趣表示。模型的整體結(jié)構(gòu)可分為**編碼器、用戶長(zhǎng)期興趣和短期興趣模型、以及候選**的個(gè)性化分?jǐn)?shù)預(yù)測(cè)模型,效果好于GRU4Rec。
15. Hierarchical Gating Networks for Sequential Recommendation, KDD 2019
作者:Chen Ma, Peng Kang, Xue Liu;
論文:t.cn/AipuFYkG;代碼:t.cn/AipuFYkb;
KDD2019,HGN提出通過(guò)feature與instance gating的多層級(jí)結(jié)構(gòu)結(jié)合BPR來(lái)更好的捕獲用戶的長(zhǎng)短期興趣,效果好于GRU4Rec以及NextItRec。
16. Behavior Sequence Transformer for E-commerce Recommendation in Alibaba, KDD 2019, Alibaba
作者:Qiwei Chen, Huan Zhao, Wei Li, Pipei Huang, Wenwu Ou
論文:t.cn/Ai9JgWoJ;解讀:t.cn/AiKBda4q
阿里巴巴搜索推薦事業(yè)部的新研究,首次使用強(qiáng)大的 Transformer 模型捕獲用戶行為序列的序列信號(hào),供電子商務(wù)場(chǎng)景的推薦系統(tǒng)使用。原有DIN 提出使用注意力機(jī)制來(lái)捕獲候選項(xiàng)與用戶先前點(diǎn)擊商品之間的相似性,但未考慮用戶行為序列背后的序列性質(zhì)。離線實(shí)驗(yàn)和在線 A/B 測(cè)試表明,BST 與現(xiàn)有方法相比有明顯優(yōu)勢(shì)。目前 BST 已經(jīng)部署在淘寶推薦的 rank 階段,每天為數(shù)億消費(fèi)者提供推薦服務(wù)[2]。
17. Operation-aware Neural Networks for User Response Prediction
作者:Yi Yang, Baile Xu, Furao Shen, Jian Zhao;
論文:t.cn/AiO2Dp5k;代碼:t.cn/Ev4H3Jm;
深度CTR預(yù)估新積木:PNN + FFM – FM = ONN模型,效果好于DeepFM和PNN。
18. BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer, Alibaba
作者:Fei Sun, Jun Liu, Jian Wu, Changhua Pei, Xiao Lin, Wenwu Ou, Peng Jiang;
論文:t.cn/AiNqPitA;
Transformer引入推薦系統(tǒng)工業(yè)界,利用用戶歷史點(diǎn)擊序列預(yù)測(cè)下一個(gè)點(diǎn)擊item,效果超過(guò)GRU4Rec。
19. A Capsule Network for Recommendation and Explaining What You Like and Dislike, SIGIR2019, Alibaba
作者:henliang Li, Cong Quan, Li Peng, Yunwei Qi, Yuming Deng, Libing Wu;
論文:t.cn/AiOLWp6x;
阿里 at SIGIR2019,膠囊神經(jīng)網(wǎng)絡(luò)應(yīng)用于推薦提出CARP模型來(lái)從評(píng)論中更好地建模用戶對(duì)商品的喜好程度,效果好于最新的ANR等。
20. Representation Learning-Assisted Click-Through Rate Prediction, IJCAI 2019, Alibaba
作者:Wentao Ouyang, Xiuwu Zhang, Shukui Ren, Chao Qi, Zhaojie Liu, Yanlong Du;
論文:t.cn/Ai0jcGIZ;代碼:t.cn/Ai0jcGIw;
阿里 at IJCAI2019,提出DeepMCP模型通過(guò)匹配、關(guān)聯(lián)、預(yù)測(cè)三個(gè)子模塊更好地建模用戶-ad,ad之間以及特征-CTR關(guān)系,效果優(yōu)于DeepFM并開(kāi)源了代碼。
拓展知識(shí):
前沿拓展:
文章轉(zhuǎn)載自**
深度傳送門 , 作者 深度傳送門
導(dǎo)讀:本文是“深度推薦系統(tǒng)”專欄的第七篇文章,這個(gè)系列將介紹在深度學(xué)習(xí)的強(qiáng)力驅(qū)動(dòng)下,給推薦系統(tǒng)工業(yè)界所帶來(lái)的最前沿的變化。本文主要小編綜合來(lái)說(shuō)一下深度推薦系統(tǒng)與CTR預(yù)估2019年值得精讀的論文。 歡迎轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)注明出處以及鏈接,更多關(guān)于深度推薦系統(tǒng)優(yōu)質(zhì)內(nèi)容請(qǐng)關(guān)注如下頻道。知乎專欄:深度推薦系統(tǒng) 微博:深度傳送門 **:深度傳送門
微博上近日流傳一個(gè)段子,“2020年曾是各大科幻片中遙遠(yuǎn)的未來(lái),但是現(xiàn)在離這個(gè)遙遠(yuǎn)的未來(lái)也只有6個(gè)月時(shí)間了”。只是借此感慨一下2019年轉(zhuǎn)瞬之間半年的時(shí)間已經(jīng)過(guò)去了,目前深度學(xué)習(xí)火熱朝天,深度學(xué)習(xí)在推薦系統(tǒng)和CTR預(yù)估工業(yè)界的論文也是一篇接著一篇良莠不齊。
接下來(lái)主要小編綜合來(lái)說(shuō)一下2019年上半年工業(yè)界深度推薦系統(tǒng)與CTR預(yù)估上值得精讀的論文。個(gè)人整理難免遺漏,也歡迎各位同行朋友評(píng)論另外哪些想額外推薦精讀的論文。
1. Top-K Off-Policy Correction for a REINFORCE Recommender System, WSDM 2019, Google
作者:Minmin Chen, Alex Beutel, Paul Covington, Sagar Jain, Francois Belletti, Ed Chi;
論文:t.cn/EUus1wu;Keynote:t.cn/EJFyMBk;
位列首位的當(dāng)屬**推薦強(qiáng)化學(xué)習(xí)的兩篇論文。雖然強(qiáng)化學(xué)習(xí)目前在推薦系統(tǒng)和CTR預(yù)估領(lǐng)域工業(yè)界由于系統(tǒng)復(fù)雜、效果未有顯著提升等眾所周知的原因確實(shí)不夠成熟也尚未大規(guī)模應(yīng)用起來(lái)。但是**推薦的這兩篇論文從某種程度上讓強(qiáng)化學(xué)習(xí)的應(yīng)用方向變得更明確了一些,而且作者在Industry Day上也宣稱線上實(shí)驗(yàn)效果顯示這個(gè)是**單個(gè)項(xiàng)目近兩年來(lái)最大的reward增長(zhǎng),也從某種程度上會(huì)激發(fā)各大公司的研究者們繼續(xù)跟進(jìn)的興趣。
這是第一篇論文,提出了一種Top-K的Off-Policy修正方案將RL中Policy-Gradient類算法得以應(yīng)用在動(dòng)作空間數(shù)以百萬(wàn)計(jì)的**在線推薦系統(tǒng)中。
2. Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology, IJCAI 2019, Google
作者:Eugene Ie, Vihan Jain, Jing Wang, …, Jim McFadden, Tushar Chandra, Craig Boutilier;
論文:t.cn/AiKFHvYU;
這是**推薦應(yīng)用強(qiáng)化學(xué)習(xí)的第二彈,主要貢獻(xiàn)是提出了一種名為SLATEQ的Q-Learning算法,優(yōu)化推薦系統(tǒng)里面同時(shí)展示給用戶多個(gè)item情況的長(zhǎng)期收益LTV(Long-term Value),將長(zhǎng)期收益加入排序多目標(biāo)中進(jìn)行建模優(yōu)化。重點(diǎn)在于與baseline使用的深度網(wǎng)絡(luò)和輸入特征都完全一樣。詳見(jiàn):**推薦已經(jīng)上線RL了,強(qiáng)化學(xué)習(xí)在推薦廣告工業(yè)界大規(guī)模應(yīng)用還遠(yuǎn)嗎?
3. Deep Learning Recommendation Model for Personalization and Recommendation Systems
作者:Maxim Naumov, Dheevatsa Mudigere, Hao-Jun Michael Shi,…, Bill Jia, Liang Xiong, Misha **elyanskiy;
論文:t.cn/Ai0rIUd0;代碼:t.cn/AiNGzCsY;解讀:t.cn/AiOX38PL;
FaceBook推薦最新論文,通過(guò)建模與系統(tǒng)協(xié)同設(shè)計(jì)提出一種butterfly-shuffle的機(jī)制來(lái)提升模型并行化,離線訓(xùn)練上在沒(méi)有任何超參調(diào)優(yōu)下收斂速度與準(zhǔn)確率優(yōu)于DCN,并開(kāi)源了代碼。
4. Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction, WWW 2019, Huawei
作者:Bin Liu, Ruiming Tang, Yingzhi Chen, Jinkai Yu, Huifeng Guo, Yuzhou Zhang;
論文:t.cn/AipAFS3p;
華為 at WWW 2019,提出基于卷積神經(jīng)網(wǎng)絡(luò)的CTR特征生成方法FGCNN,包含特征生成和深度分類器兩部分,可以和任意CTR預(yù)估模型進(jìn)行組合。
5. Deep Spatio-Temporal Neural Networks for Click-Through Rate Prediction, KDD 2019, Alibaba
作者:Wentao Ouyang, Xiuwu Zhang, Li Li, Heng Zou, Xin Xing, Zhaojie Liu, Yanlong Du;
論文:t.cn/Ai0jTY68;代碼:t.cn/Ai0jTY6u;
阿里 at KDD 2019,提出DSTN模型用于點(diǎn)擊率CTR預(yù)估,考慮更多空域與時(shí)域的輔助信息包括上下文展示過(guò)的ad以及歷史點(diǎn)擊/未點(diǎn)擊ad來(lái)更好地預(yù)測(cè)目標(biāo)item的點(diǎn)擊率。從論文實(shí)驗(yàn)數(shù)據(jù)看,效果大幅度超過(guò)DeepFM和GRU,并開(kāi)源了代碼。
6. AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks
作者:Weiping Song, Chence Shi, Zhiping Xiao, Zhijian Duan, Yewen Xu, Ming Zhang, Jian Tang;
論文:t.cn/AipG8aXz;代碼:t.cn/EI8Pnso;
最新的深度CTR預(yù)估模型AutoInt,通過(guò)過(guò)Multi-head注意力機(jī)制將特征投射到多個(gè)子空間中,并在不同的子空間中捕獲不同的特征組合形式,效果超過(guò)xDeepFM等達(dá)到最好。
7. Real-time Attention Based Look-alike Model for Recommender System, KDD 2019, Tencent
作者:Yudan Liu, Kaikai Ge, Xu Zhang, Leyu Lin
論文:t.cn/AiOaAg1Q;解讀:t.cn/AiOaAg1E;
騰訊 at KDD2019,微信看一看團(tuán)隊(duì)對(duì)傳統(tǒng)Look-alike進(jìn)行了改造,提出實(shí)時(shí)Look-alike算法RALM,解決推薦系統(tǒng)多樣性問(wèn)題,效果好于**DNN。
8. Joint Optimization of Tree-based Index and Deep Model for Recommender Systems
作者:Han Zhu, Daqing Chang, Ziru Xu, Pengye Zhang, Xiang Li, Jie He, Han Li, Jian Xu, Kun Gai;
論文:t.cn/AiN5T8Ks;TDM論文:t.cn/RQ5MrSg;
還記得阿里 at KDD 2018的深度樹(shù)匹配召回模型TDM嗎?升級(jí)版JTM提出索引與模型同時(shí)優(yōu)化的方案,大幅提升召回效果。
9. A User-Centered Concept Mining System for Query and Document Understanding at Tencent, KDD 2019, Tencent
作者:Bang Liu, Weidong Guo, Di Niu, Chaoyue Wang, Shunnan Xu, Jinghong Lin, Kunfeng Lai, Yu Xu
論文:t.cn/Ai09Dxkd;解讀:t.cn/Ai09DxkB;數(shù)據(jù)資源:t.cn/Ai09Dxkr;
騰訊 at KDD2019,構(gòu)建了ConcepT概念挖掘標(biāo)記系統(tǒng),利用query搜索點(diǎn)擊日志從用戶視角提取不同的概念,以提高對(duì)短文本(query)和長(zhǎng)文章(document)的理解,從而推動(dòng)推薦,搜索等業(yè)務(wù)的提升。實(shí)驗(yàn)證明,ConcepT在 QQ 瀏覽器信息流業(yè)務(wù)中性能優(yōu)異,曝光效率相對(duì)提升6.01%。
10. Deep Session Interest Network for Click-Through Rate Prediction, IJCAI 2019, Alibaba
作者:Yufei Feng, Fuyu Lv, Weichen Shen, Menghan Wang, Fei Sun, Yu Zhu, Keping Yang;
論文:t.cn/AiN9QZnV;代碼:t.cn/AiN9QZnV;
阿里 at IJCAI2019,考慮到不同用戶行為序列的session內(nèi)行為同構(gòu)與session之間行為異構(gòu)的特性提出了基于sesssion的CTR預(yù)估模型DSIN。使用self-attention機(jī)制抽取session內(nèi)用戶興趣,使用Bi-LSTM針對(duì)用戶跨session興趣進(jìn)行建模。
11. Interaction-aware Factorization Machines for Recommender Systems, AAAI2019, Tencent
作者:Fuxing Hong, Dongbo Huang, Ge Chen;
論文:t.cn/Ai0WHak5;代碼:t.cn/Ai0WHakt;
騰訊 at AAAI2019,提出IFM通過(guò)特征以及特征組不同角度靈活學(xué)習(xí)特征間交互的重要性,并提出了通用的Interation-NN框架和DeepIFM來(lái)捕捉高階交互,效果優(yōu)于DeepFM并開(kāi)源了代碼。
12. Multi-Interest Network with Dynamic Routing for Recommendation at Tmall
作者:Chao Li, Zhiyuan Liu, Mengmeng Wu, …, Qiwei Chen, Wei Li, Dik Lun Lee
論文:t.cn/AiOao6I4;解讀:t.cn/AiOao6I4;
阿里天貓?zhí)岢鯩IND模型通過(guò)Dynamic Routing的方法從用戶行為和用戶屬性信息中動(dòng)態(tài)學(xué)習(xí)出多個(gè)表示用戶興趣的向量,更好的捕捉用戶的多樣興趣,來(lái)提升召回的豐富度和準(zhǔn)確度,效果好于**DNN。
13. Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction, KDD 2019, Alibaba
作者:Qi Pi, Weijie Bian, Guorui Zhou, Xiaoqiang Zhu, Kun Gai;
論文:t.cn/AiN4s4oe;
阿里 at KDD2019,通過(guò)系統(tǒng)設(shè)計(jì)解決用戶超長(zhǎng)行為歷史下CTR建模與在線預(yù)測(cè)性能瓶頸,效果好于GRU4Rec和DIEN。
14. Neural News Recommendation with Long- and Short-term User Representations, ACL 2019, Microsoft
作者:Mingxiao An,F(xiàn)angzhao Wu,Chuhan Wu,Kun Zhang,Zheng Liu,Xing Xie;
論文:t.cn/Ai029G81;
微軟 at ACL 2019,LSTUR用于在**推薦任務(wù)中同時(shí)學(xué)習(xí)用戶長(zhǎng)期和短期的興趣表示。模型的整體結(jié)構(gòu)可分為**編碼器、用戶長(zhǎng)期興趣和短期興趣模型、以及候選**的個(gè)性化分?jǐn)?shù)預(yù)測(cè)模型,效果好于GRU4Rec。
15. Hierarchical Gating Networks for Sequential Recommendation, KDD 2019
作者:Chen Ma, Peng Kang, Xue Liu;
論文:t.cn/AipuFYkG;代碼:t.cn/AipuFYkb;
KDD2019,HGN提出通過(guò)feature與instance gating的多層級(jí)結(jié)構(gòu)結(jié)合BPR來(lái)更好的捕獲用戶的長(zhǎng)短期興趣,效果好于GRU4Rec以及NextItRec。
16. Behavior Sequence Transformer for E-commerce Recommendation in Alibaba, KDD 2019, Alibaba
作者:Qiwei Chen, Huan Zhao, Wei Li, Pipei Huang, Wenwu Ou
論文:t.cn/Ai9JgWoJ;解讀:t.cn/AiKBda4q
阿里巴巴搜索推薦事業(yè)部的新研究,首次使用強(qiáng)大的 Transformer 模型捕獲用戶行為序列的序列信號(hào),供電子商務(wù)場(chǎng)景的推薦系統(tǒng)使用。原有DIN 提出使用注意力機(jī)制來(lái)捕獲候選項(xiàng)與用戶先前點(diǎn)擊商品之間的相似性,但未考慮用戶行為序列背后的序列性質(zhì)。離線實(shí)驗(yàn)和在線 A/B 測(cè)試表明,BST 與現(xiàn)有方法相比有明顯優(yōu)勢(shì)。目前 BST 已經(jīng)部署在淘寶推薦的 rank 階段,每天為數(shù)億消費(fèi)者提供推薦服務(wù)[2]。
17. Operation-aware Neural Networks for User Response Prediction
作者:Yi Yang, Baile Xu, Furao Shen, Jian Zhao;
論文:t.cn/AiO2Dp5k;代碼:t.cn/Ev4H3Jm;
深度CTR預(yù)估新積木:PNN + FFM – FM = ONN模型,效果好于DeepFM和PNN。
18. BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer, Alibaba
作者:Fei Sun, Jun Liu, Jian Wu, Changhua Pei, Xiao Lin, Wenwu Ou, Peng Jiang;
論文:t.cn/AiNqPitA;
Transformer引入推薦系統(tǒng)工業(yè)界,利用用戶歷史點(diǎn)擊序列預(yù)測(cè)下一個(gè)點(diǎn)擊item,效果超過(guò)GRU4Rec。
19. A Capsule Network for Recommendation and Explaining What You Like and Dislike, SIGIR2019, Alibaba
作者:henliang Li, Cong Quan, Li Peng, Yunwei Qi, Yuming Deng, Libing Wu;
論文:t.cn/AiOLWp6x;
阿里 at SIGIR2019,膠囊神經(jīng)網(wǎng)絡(luò)應(yīng)用于推薦提出CARP模型來(lái)從評(píng)論中更好地建模用戶對(duì)商品的喜好程度,效果好于最新的ANR等。
20. Representation Learning-Assisted Click-Through Rate Prediction, IJCAI 2019, Alibaba
作者:Wentao Ouyang, Xiuwu Zhang, Shukui Ren, Chao Qi, Zhaojie Liu, Yanlong Du;
論文:t.cn/Ai0jcGIZ;代碼:t.cn/Ai0jcGIw;
阿里 at IJCAI2019,提出DeepMCP模型通過(guò)匹配、關(guān)聯(lián)、預(yù)測(cè)三個(gè)子模塊更好地建模用戶-ad,ad之間以及特征-CTR關(guān)系,效果優(yōu)于DeepFM并開(kāi)源了代碼。
拓展知識(shí):
前沿拓展:
文章轉(zhuǎn)載自**
深度傳送門 , 作者 深度傳送門
導(dǎo)讀:本文是“深度推薦系統(tǒng)”專欄的第七篇文章,這個(gè)系列將介紹在深度學(xué)習(xí)的強(qiáng)力驅(qū)動(dòng)下,給推薦系統(tǒng)工業(yè)界所帶來(lái)的最前沿的變化。本文主要小編綜合來(lái)說(shuō)一下深度推薦系統(tǒng)與CTR預(yù)估2019年值得精讀的論文。 歡迎轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)注明出處以及鏈接,更多關(guān)于深度推薦系統(tǒng)優(yōu)質(zhì)內(nèi)容請(qǐng)關(guān)注如下頻道。知乎專欄:深度推薦系統(tǒng) 微博:深度傳送門 **:深度傳送門
微博上近日流傳一個(gè)段子,“2020年曾是各大科幻片中遙遠(yuǎn)的未來(lái),但是現(xiàn)在離這個(gè)遙遠(yuǎn)的未來(lái)也只有6個(gè)月時(shí)間了”。只是借此感慨一下2019年轉(zhuǎn)瞬之間半年的時(shí)間已經(jīng)過(guò)去了,目前深度學(xué)習(xí)火熱朝天,深度學(xué)習(xí)在推薦系統(tǒng)和CTR預(yù)估工業(yè)界的論文也是一篇接著一篇良莠不齊。
接下來(lái)主要小編綜合來(lái)說(shuō)一下2019年上半年工業(yè)界深度推薦系統(tǒng)與CTR預(yù)估上值得精讀的論文。個(gè)人整理難免遺漏,也歡迎各位同行朋友評(píng)論另外哪些想額外推薦精讀的論文。
1. Top-K Off-Policy Correction for a REINFORCE Recommender System, WSDM 2019, Google
作者:Minmin Chen, Alex Beutel, Paul Covington, Sagar Jain, Francois Belletti, Ed Chi;
論文:t.cn/EUus1wu;Keynote:t.cn/EJFyMBk;
位列首位的當(dāng)屬**推薦強(qiáng)化學(xué)習(xí)的兩篇論文。雖然強(qiáng)化學(xué)習(xí)目前在推薦系統(tǒng)和CTR預(yù)估領(lǐng)域工業(yè)界由于系統(tǒng)復(fù)雜、效果未有顯著提升等眾所周知的原因確實(shí)不夠成熟也尚未大規(guī)模應(yīng)用起來(lái)。但是**推薦的這兩篇論文從某種程度上讓強(qiáng)化學(xué)習(xí)的應(yīng)用方向變得更明確了一些,而且作者在Industry Day上也宣稱線上實(shí)驗(yàn)效果顯示這個(gè)是**單個(gè)項(xiàng)目近兩年來(lái)最大的reward增長(zhǎng),也從某種程度上會(huì)激發(fā)各大公司的研究者們繼續(xù)跟進(jìn)的興趣。
這是第一篇論文,提出了一種Top-K的Off-Policy修正方案將RL中Policy-Gradient類算法得以應(yīng)用在動(dòng)作空間數(shù)以百萬(wàn)計(jì)的**在線推薦系統(tǒng)中。
2. Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology, IJCAI 2019, Google
作者:Eugene Ie, Vihan Jain, Jing Wang, …, Jim McFadden, Tushar Chandra, Craig Boutilier;
論文:t.cn/AiKFHvYU;
這是**推薦應(yīng)用強(qiáng)化學(xué)習(xí)的第二彈,主要貢獻(xiàn)是提出了一種名為SLATEQ的Q-Learning算法,優(yōu)化推薦系統(tǒng)里面同時(shí)展示給用戶多個(gè)item情況的長(zhǎng)期收益LTV(Long-term Value),將長(zhǎng)期收益加入排序多目標(biāo)中進(jìn)行建模優(yōu)化。重點(diǎn)在于與baseline使用的深度網(wǎng)絡(luò)和輸入特征都完全一樣。詳見(jiàn):**推薦已經(jīng)上線RL了,強(qiáng)化學(xué)習(xí)在推薦廣告工業(yè)界大規(guī)模應(yīng)用還遠(yuǎn)嗎?
3. Deep Learning Recommendation Model for Personalization and Recommendation Systems
作者:Maxim Naumov, Dheevatsa Mudigere, Hao-Jun Michael Shi,…, Bill Jia, Liang Xiong, Misha **elyanskiy;
論文:t.cn/Ai0rIUd0;代碼:t.cn/AiNGzCsY;解讀:t.cn/AiOX38PL;
FaceBook推薦最新論文,通過(guò)建模與系統(tǒng)協(xié)同設(shè)計(jì)提出一種butterfly-shuffle的機(jī)制來(lái)提升模型并行化,離線訓(xùn)練上在沒(méi)有任何超參調(diào)優(yōu)下收斂速度與準(zhǔn)確率優(yōu)于DCN,并開(kāi)源了代碼。
4. Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction, WWW 2019, Huawei
作者:Bin Liu, Ruiming Tang, Yingzhi Chen, Jinkai Yu, Huifeng Guo, Yuzhou Zhang;
論文:t.cn/AipAFS3p;
華為 at WWW 2019,提出基于卷積神經(jīng)網(wǎng)絡(luò)的CTR特征生成方法FGCNN,包含特征生成和深度分類器兩部分,可以和任意CTR預(yù)估模型進(jìn)行組合。
5. Deep Spatio-Temporal Neural Networks for Click-Through Rate Prediction, KDD 2019, Alibaba
作者:Wentao Ouyang, Xiuwu Zhang, Li Li, Heng Zou, Xin Xing, Zhaojie Liu, Yanlong Du;
論文:t.cn/Ai0jTY68;代碼:t.cn/Ai0jTY6u;
阿里 at KDD 2019,提出DSTN模型用于點(diǎn)擊率CTR預(yù)估,考慮更多空域與時(shí)域的輔助信息包括上下文展示過(guò)的ad以及歷史點(diǎn)擊/未點(diǎn)擊ad來(lái)更好地預(yù)測(cè)目標(biāo)item的點(diǎn)擊率。從論文實(shí)驗(yàn)數(shù)據(jù)看,效果大幅度超過(guò)DeepFM和GRU,并開(kāi)源了代碼。
6. AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks
作者:Weiping Song, Chence Shi, Zhiping Xiao, Zhijian Duan, Yewen Xu, Ming Zhang, Jian Tang;
論文:t.cn/AipG8aXz;代碼:t.cn/EI8Pnso;
最新的深度CTR預(yù)估模型AutoInt,通過(guò)過(guò)Multi-head注意力機(jī)制將特征投射到多個(gè)子空間中,并在不同的子空間中捕獲不同的特征組合形式,效果超過(guò)xDeepFM等達(dá)到最好。
7. Real-time Attention Based Look-alike Model for Recommender System, KDD 2019, Tencent
作者:Yudan Liu, Kaikai Ge, Xu Zhang, Leyu Lin
論文:t.cn/AiOaAg1Q;解讀:t.cn/AiOaAg1E;
騰訊 at KDD2019,微信看一看團(tuán)隊(duì)對(duì)傳統(tǒng)Look-alike進(jìn)行了改造,提出實(shí)時(shí)Look-alike算法RALM,解決推薦系統(tǒng)多樣性問(wèn)題,效果好于**DNN。
8. Joint Optimization of Tree-based Index and Deep Model for Recommender Systems
作者:Han Zhu, Daqing Chang, Ziru Xu, Pengye Zhang, Xiang Li, Jie He, Han Li, Jian Xu, Kun Gai;
論文:t.cn/AiN5T8Ks;TDM論文:t.cn/RQ5MrSg;
還記得阿里 at KDD 2018的深度樹(shù)匹配召回模型TDM嗎?升級(jí)版JTM提出索引與模型同時(shí)優(yōu)化的方案,大幅提升召回效果。
9. A User-Centered Concept Mining System for Query and Document Understanding at Tencent, KDD 2019, Tencent
作者:Bang Liu, Weidong Guo, Di Niu, Chaoyue Wang, Shunnan Xu, Jinghong Lin, Kunfeng Lai, Yu Xu
論文:t.cn/Ai09Dxkd;解讀:t.cn/Ai09DxkB;數(shù)據(jù)資源:t.cn/Ai09Dxkr;
騰訊 at KDD2019,構(gòu)建了ConcepT概念挖掘標(biāo)記系統(tǒng),利用query搜索點(diǎn)擊日志從用戶視角提取不同的概念,以提高對(duì)短文本(query)和長(zhǎng)文章(document)的理解,從而推動(dòng)推薦,搜索等業(yè)務(wù)的提升。實(shí)驗(yàn)證明,ConcepT在 QQ 瀏覽器信息流業(yè)務(wù)中性能優(yōu)異,曝光效率相對(duì)提升6.01%。
10. Deep Session Interest Network for Click-Through Rate Prediction, IJCAI 2019, Alibaba
作者:Yufei Feng, Fuyu Lv, Weichen Shen, Menghan Wang, Fei Sun, Yu Zhu, Keping Yang;
論文:t.cn/AiN9QZnV;代碼:t.cn/AiN9QZnV;
阿里 at IJCAI2019,考慮到不同用戶行為序列的session內(nèi)行為同構(gòu)與session之間行為異構(gòu)的特性提出了基于sesssion的CTR預(yù)估模型DSIN。使用self-attention機(jī)制抽取session內(nèi)用戶興趣,使用Bi-LSTM針對(duì)用戶跨session興趣進(jìn)行建模。
11. Interaction-aware Factorization Machines for Recommender Systems, AAAI2019, Tencent
作者:Fuxing Hong, Dongbo Huang, Ge Chen;
論文:t.cn/Ai0WHak5;代碼:t.cn/Ai0WHakt;
騰訊 at AAAI2019,提出IFM通過(guò)特征以及特征組不同角度靈活學(xué)習(xí)特征間交互的重要性,并提出了通用的Interation-NN框架和DeepIFM來(lái)捕捉高階交互,效果優(yōu)于DeepFM并開(kāi)源了代碼。
12. Multi-Interest Network with Dynamic Routing for Recommendation at Tmall
作者:Chao Li, Zhiyuan Liu, Mengmeng Wu, …, Qiwei Chen, Wei Li, Dik Lun Lee
論文:t.cn/AiOao6I4;解讀:t.cn/AiOao6I4;
阿里天貓?zhí)岢鯩IND模型通過(guò)Dynamic Routing的方法從用戶行為和用戶屬性信息中動(dòng)態(tài)學(xué)習(xí)出多個(gè)表示用戶興趣的向量,更好的捕捉用戶的多樣興趣,來(lái)提升召回的豐富度和準(zhǔn)確度,效果好于**DNN。
13. Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction, KDD 2019, Alibaba
作者:Qi Pi, Weijie Bian, Guorui Zhou, Xiaoqiang Zhu, Kun Gai;
論文:t.cn/AiN4s4oe;
阿里 at KDD2019,通過(guò)系統(tǒng)設(shè)計(jì)解決用戶超長(zhǎng)行為歷史下CTR建模與在線預(yù)測(cè)性能瓶頸,效果好于GRU4Rec和DIEN。
14. Neural News Recommendation with Long- and Short-term User Representations, ACL 2019, Microsoft
作者:Mingxiao An,F(xiàn)angzhao Wu,Chuhan Wu,Kun Zhang,Zheng Liu,Xing Xie;
論文:t.cn/Ai029G81;
微軟 at ACL 2019,LSTUR用于在**推薦任務(wù)中同時(shí)學(xué)習(xí)用戶長(zhǎng)期和短期的興趣表示。模型的整體結(jié)構(gòu)可分為**編碼器、用戶長(zhǎng)期興趣和短期興趣模型、以及候選**的個(gè)性化分?jǐn)?shù)預(yù)測(cè)模型,效果好于GRU4Rec。
15. Hierarchical Gating Networks for Sequential Recommendation, KDD 2019
作者:Chen Ma, Peng Kang, Xue Liu;
論文:t.cn/AipuFYkG;代碼:t.cn/AipuFYkb;
KDD2019,HGN提出通過(guò)feature與instance gating的多層級(jí)結(jié)構(gòu)結(jié)合BPR來(lái)更好的捕獲用戶的長(zhǎng)短期興趣,效果好于GRU4Rec以及NextItRec。
16. Behavior Sequence Transformer for E-commerce Recommendation in Alibaba, KDD 2019, Alibaba
作者:Qiwei Chen, Huan Zhao, Wei Li, Pipei Huang, Wenwu Ou
論文:t.cn/Ai9JgWoJ;解讀:t.cn/AiKBda4q
阿里巴巴搜索推薦事業(yè)部的新研究,首次使用強(qiáng)大的 Transformer 模型捕獲用戶行為序列的序列信號(hào),供電子商務(wù)場(chǎng)景的推薦系統(tǒng)使用。原有DIN 提出使用注意力機(jī)制來(lái)捕獲候選項(xiàng)與用戶先前點(diǎn)擊商品之間的相似性,但未考慮用戶行為序列背后的序列性質(zhì)。離線實(shí)驗(yàn)和在線 A/B 測(cè)試表明,BST 與現(xiàn)有方法相比有明顯優(yōu)勢(shì)。目前 BST 已經(jīng)部署在淘寶推薦的 rank 階段,每天為數(shù)億消費(fèi)者提供推薦服務(wù)[2]。
17. Operation-aware Neural Networks for User Response Prediction
作者:Yi Yang, Baile Xu, Furao Shen, Jian Zhao;
論文:t.cn/AiO2Dp5k;代碼:t.cn/Ev4H3Jm;
深度CTR預(yù)估新積木:PNN + FFM – FM = ONN模型,效果好于DeepFM和PNN。
18. BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer, Alibaba
作者:Fei Sun, Jun Liu, Jian Wu, Changhua Pei, Xiao Lin, Wenwu Ou, Peng Jiang;
論文:t.cn/AiNqPitA;
Transformer引入推薦系統(tǒng)工業(yè)界,利用用戶歷史點(diǎn)擊序列預(yù)測(cè)下一個(gè)點(diǎn)擊item,效果超過(guò)GRU4Rec。
19. A Capsule Network for Recommendation and Explaining What You Like and Dislike, SIGIR2019, Alibaba
作者:henliang Li, Cong Quan, Li Peng, Yunwei Qi, Yuming Deng, Libing Wu;
論文:t.cn/AiOLWp6x;
阿里 at SIGIR2019,膠囊神經(jīng)網(wǎng)絡(luò)應(yīng)用于推薦提出CARP模型來(lái)從評(píng)論中更好地建模用戶對(duì)商品的喜好程度,效果好于最新的ANR等。
20. Representation Learning-Assisted Click-Through Rate Prediction, IJCAI 2019, Alibaba
作者:Wentao Ouyang, Xiuwu Zhang, Shukui Ren, Chao Qi, Zhaojie Liu, Yanlong Du;
論文:t.cn/Ai0jcGIZ;代碼:t.cn/Ai0jcGIw;
阿里 at IJCAI2019,提出DeepMCP模型通過(guò)匹配、關(guān)聯(lián)、預(yù)測(cè)三個(gè)子模塊更好地建模用戶-ad,ad之間以及特征-CTR關(guān)系,效果優(yōu)于DeepFM并開(kāi)源了代碼。
拓展知識(shí):
前沿拓展:
文章轉(zhuǎn)載自**
深度傳送門 , 作者 深度傳送門
導(dǎo)讀:本文是“深度推薦系統(tǒng)”專欄的第七篇文章,這個(gè)系列將介紹在深度學(xué)習(xí)的強(qiáng)力驅(qū)動(dòng)下,給推薦系統(tǒng)工業(yè)界所帶來(lái)的最前沿的變化。本文主要小編綜合來(lái)說(shuō)一下深度推薦系統(tǒng)與CTR預(yù)估2019年值得精讀的論文。 歡迎轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)注明出處以及鏈接,更多關(guān)于深度推薦系統(tǒng)優(yōu)質(zhì)內(nèi)容請(qǐng)關(guān)注如下頻道。知乎專欄:深度推薦系統(tǒng) 微博:深度傳送門 **:深度傳送門
微博上近日流傳一個(gè)段子,“2020年曾是各大科幻片中遙遠(yuǎn)的未來(lái),但是現(xiàn)在離這個(gè)遙遠(yuǎn)的未來(lái)也只有6個(gè)月時(shí)間了”。只是借此感慨一下2019年轉(zhuǎn)瞬之間半年的時(shí)間已經(jīng)過(guò)去了,目前深度學(xué)習(xí)火熱朝天,深度學(xué)習(xí)在推薦系統(tǒng)和CTR預(yù)估工業(yè)界的論文也是一篇接著一篇良莠不齊。
接下來(lái)主要小編綜合來(lái)說(shuō)一下2019年上半年工業(yè)界深度推薦系統(tǒng)與CTR預(yù)估上值得精讀的論文。個(gè)人整理難免遺漏,也歡迎各位同行朋友評(píng)論另外哪些想額外推薦精讀的論文。
1. Top-K Off-Policy Correction for a REINFORCE Recommender System, WSDM 2019, Google
作者:Minmin Chen, Alex Beutel, Paul Covington, Sagar Jain, Francois Belletti, Ed Chi;
論文:t.cn/EUus1wu;Keynote:t.cn/EJFyMBk;
位列首位的當(dāng)屬**推薦強(qiáng)化學(xué)習(xí)的兩篇論文。雖然強(qiáng)化學(xué)習(xí)目前在推薦系統(tǒng)和CTR預(yù)估領(lǐng)域工業(yè)界由于系統(tǒng)復(fù)雜、效果未有顯著提升等眾所周知的原因確實(shí)不夠成熟也尚未大規(guī)模應(yīng)用起來(lái)。但是**推薦的這兩篇論文從某種程度上讓強(qiáng)化學(xué)習(xí)的應(yīng)用方向變得更明確了一些,而且作者在Industry Day上也宣稱線上實(shí)驗(yàn)效果顯示這個(gè)是**單個(gè)項(xiàng)目近兩年來(lái)最大的reward增長(zhǎng),也從某種程度上會(huì)激發(fā)各大公司的研究者們繼續(xù)跟進(jìn)的興趣。
這是第一篇論文,提出了一種Top-K的Off-Policy修正方案將RL中Policy-Gradient類算法得以應(yīng)用在動(dòng)作空間數(shù)以百萬(wàn)計(jì)的**在線推薦系統(tǒng)中。
2. Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology, IJCAI 2019, Google
作者:Eugene Ie, Vihan Jain, Jing Wang, …, Jim McFadden, Tushar Chandra, Craig Boutilier;
論文:t.cn/AiKFHvYU;
這是**推薦應(yīng)用強(qiáng)化學(xué)習(xí)的第二彈,主要貢獻(xiàn)是提出了一種名為SLATEQ的Q-Learning算法,優(yōu)化推薦系統(tǒng)里面同時(shí)展示給用戶多個(gè)item情況的長(zhǎng)期收益LTV(Long-term Value),將長(zhǎng)期收益加入排序多目標(biāo)中進(jìn)行建模優(yōu)化。重點(diǎn)在于與baseline使用的深度網(wǎng)絡(luò)和輸入特征都完全一樣。詳見(jiàn):**推薦已經(jīng)上線RL了,強(qiáng)化學(xué)習(xí)在推薦廣告工業(yè)界大規(guī)模應(yīng)用還遠(yuǎn)嗎?
3. Deep Learning Recommendation Model for Personalization and Recommendation Systems
作者:Maxim Naumov, Dheevatsa Mudigere, Hao-Jun Michael Shi,…, Bill Jia, Liang Xiong, Misha **elyanskiy;
論文:t.cn/Ai0rIUd0;代碼:t.cn/AiNGzCsY;解讀:t.cn/AiOX38PL;
FaceBook推薦最新論文,通過(guò)建模與系統(tǒng)協(xié)同設(shè)計(jì)提出一種butterfly-shuffle的機(jī)制來(lái)提升模型并行化,離線訓(xùn)練上在沒(méi)有任何超參調(diào)優(yōu)下收斂速度與準(zhǔn)確率優(yōu)于DCN,并開(kāi)源了代碼。
4. Feature Generation by Convolutional Neural Network for Click-Through Rate Prediction, WWW 2019, Huawei
作者:Bin Liu, Ruiming Tang, Yingzhi Chen, Jinkai Yu, Huifeng Guo, Yuzhou Zhang;
論文:t.cn/AipAFS3p;
華為 at WWW 2019,提出基于卷積神經(jīng)網(wǎng)絡(luò)的CTR特征生成方法FGCNN,包含特征生成和深度分類器兩部分,可以和任意CTR預(yù)估模型進(jìn)行組合。
5. Deep Spatio-Temporal Neural Networks for Click-Through Rate Prediction, KDD 2019, Alibaba
作者:Wentao Ouyang, Xiuwu Zhang, Li Li, Heng Zou, Xin Xing, Zhaojie Liu, Yanlong Du;
論文:t.cn/Ai0jTY68;代碼:t.cn/Ai0jTY6u;
阿里 at KDD 2019,提出DSTN模型用于點(diǎn)擊率CTR預(yù)估,考慮更多空域與時(shí)域的輔助信息包括上下文展示過(guò)的ad以及歷史點(diǎn)擊/未點(diǎn)擊ad來(lái)更好地預(yù)測(cè)目標(biāo)item的點(diǎn)擊率。從論文實(shí)驗(yàn)數(shù)據(jù)看,效果大幅度超過(guò)DeepFM和GRU,并開(kāi)源了代碼。
6. AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks
作者:Weiping Song, Chence Shi, Zhiping Xiao, Zhijian Duan, Yewen Xu, Ming Zhang, Jian Tang;
論文:t.cn/AipG8aXz;代碼:t.cn/EI8Pnso;
最新的深度CTR預(yù)估模型AutoInt,通過(guò)過(guò)Multi-head注意力機(jī)制將特征投射到多個(gè)子空間中,并在不同的子空間中捕獲不同的特征組合形式,效果超過(guò)xDeepFM等達(dá)到最好。
7. Real-time Attention Based Look-alike Model for Recommender System, KDD 2019, Tencent
作者:Yudan Liu, Kaikai Ge, Xu Zhang, Leyu Lin
論文:t.cn/AiOaAg1Q;解讀:t.cn/AiOaAg1E;
騰訊 at KDD2019,微信看一看團(tuán)隊(duì)對(duì)傳統(tǒng)Look-alike進(jìn)行了改造,提出實(shí)時(shí)Look-alike算法RALM,解決推薦系統(tǒng)多樣性問(wèn)題,效果好于**DNN。
8. Joint Optimization of Tree-based Index and Deep Model for Recommender Systems
作者:Han Zhu, Daqing Chang, Ziru Xu, Pengye Zhang, Xiang Li, Jie He, Han Li, Jian Xu, Kun Gai;
論文:t.cn/AiN5T8Ks;TDM論文:t.cn/RQ5MrSg;
還記得阿里 at KDD 2018的深度樹(shù)匹配召回模型TDM嗎?升級(jí)版JTM提出索引與模型同時(shí)優(yōu)化的方案,大幅提升召回效果。
9. A User-Centered Concept Mining System for Query and Document Understanding at Tencent, KDD 2019, Tencent
作者:Bang Liu, Weidong Guo, Di Niu, Chaoyue Wang, Shunnan Xu, Jinghong Lin, Kunfeng Lai, Yu Xu
論文:t.cn/Ai09Dxkd;解讀:t.cn/Ai09DxkB;數(shù)據(jù)資源:t.cn/Ai09Dxkr;
騰訊 at KDD2019,構(gòu)建了ConcepT概念挖掘標(biāo)記系統(tǒng),利用query搜索點(diǎn)擊日志從用戶視角提取不同的概念,以提高對(duì)短文本(query)和長(zhǎng)文章(document)的理解,從而推動(dòng)推薦,搜索等業(yè)務(wù)的提升。實(shí)驗(yàn)證明,ConcepT在 QQ 瀏覽器信息流業(yè)務(wù)中性能優(yōu)異,曝光效率相對(duì)提升6.01%。
10. Deep Session Interest Network for Click-Through Rate Prediction, IJCAI 2019, Alibaba
作者:Yufei Feng, Fuyu Lv, Weichen Shen, Menghan Wang, Fei Sun, Yu Zhu, Keping Yang;
論文:t.cn/AiN9QZnV;代碼:t.cn/AiN9QZnV;
阿里 at IJCAI2019,考慮到不同用戶行為序列的session內(nèi)行為同構(gòu)與session之間行為異構(gòu)的特性提出了基于sesssion的CTR預(yù)估模型DSIN。使用self-attention機(jī)制抽取session內(nèi)用戶興趣,使用Bi-LSTM針對(duì)用戶跨session興趣進(jìn)行建模。
11. Interaction-aware Factorization Machines for Recommender Systems, AAAI2019, Tencent
作者:Fuxing Hong, Dongbo Huang, Ge Chen;
論文:t.cn/Ai0WHak5;代碼:t.cn/Ai0WHakt;
騰訊 at AAAI2019,提出IFM通過(guò)特征以及特征組不同角度靈活學(xué)習(xí)特征間交互的重要性,并提出了通用的Interation-NN框架和DeepIFM來(lái)捕捉高階交互,效果優(yōu)于DeepFM并開(kāi)源了代碼。
12. Multi-Interest Network with Dynamic Routing for Recommendation at Tmall
作者:Chao Li, Zhiyuan Liu, Mengmeng Wu, …, Qiwei Chen, Wei Li, Dik Lun Lee
論文:t.cn/AiOao6I4;解讀:t.cn/AiOao6I4;
阿里天貓?zhí)岢鯩IND模型通過(guò)Dynamic Routing的方法從用戶行為和用戶屬性信息中動(dòng)態(tài)學(xué)習(xí)出多個(gè)表示用戶興趣的向量,更好的捕捉用戶的多樣興趣,來(lái)提升召回的豐富度和準(zhǔn)確度,效果好于**DNN。
13. Practice on Long Sequential User Behavior Modeling for Click-Through Rate Prediction, KDD 2019, Alibaba
作者:Qi Pi, Weijie Bian, Guorui Zhou, Xiaoqiang Zhu, Kun Gai;
論文:t.cn/AiN4s4oe;
阿里 at KDD2019,通過(guò)系統(tǒng)設(shè)計(jì)解決用戶超長(zhǎng)行為歷史下CTR建模與在線預(yù)測(cè)性能瓶頸,效果好于GRU4Rec和DIEN。
14. Neural News Recommendation with Long- and Short-term User Representations, ACL 2019, Microsoft
作者:Mingxiao An,F(xiàn)angzhao Wu,Chuhan Wu,Kun Zhang,Zheng Liu,Xing Xie;
論文:t.cn/Ai029G81;
微軟 at ACL 2019,LSTUR用于在**推薦任務(wù)中同時(shí)學(xué)習(xí)用戶長(zhǎng)期和短期的興趣表示。模型的整體結(jié)構(gòu)可分為**編碼器、用戶長(zhǎng)期興趣和短期興趣模型、以及候選**的個(gè)性化分?jǐn)?shù)預(yù)測(cè)模型,效果好于GRU4Rec。
15. Hierarchical Gating Networks for Sequential Recommendation, KDD 2019
作者:Chen Ma, Peng Kang, Xue Liu;
論文:t.cn/AipuFYkG;代碼:t.cn/AipuFYkb;
KDD2019,HGN提出通過(guò)feature與instance gating的多層級(jí)結(jié)構(gòu)結(jié)合BPR來(lái)更好的捕獲用戶的長(zhǎng)短期興趣,效果好于GRU4Rec以及NextItRec。
16. Behavior Sequence Transformer for E-commerce Recommendation in Alibaba, KDD 2019, Alibaba
作者:Qiwei Chen, Huan Zhao, Wei Li, Pipei Huang, Wenwu Ou
論文:t.cn/Ai9JgWoJ;解讀:t.cn/AiKBda4q
阿里巴巴搜索推薦事業(yè)部的新研究,首次使用強(qiáng)大的 Transformer 模型捕獲用戶行為序列的序列信號(hào),供電子商務(wù)場(chǎng)景的推薦系統(tǒng)使用。原有DIN 提出使用注意力機(jī)制來(lái)捕獲候選項(xiàng)與用戶先前點(diǎn)擊商品之間的相似性,但未考慮用戶行為序列背后的序列性質(zhì)。離線實(shí)驗(yàn)和在線 A/B 測(cè)試表明,BST 與現(xiàn)有方法相比有明顯優(yōu)勢(shì)。目前 BST 已經(jīng)部署在淘寶推薦的 rank 階段,每天為數(shù)億消費(fèi)者提供推薦服務(wù)[2]。
17. Operation-aware Neural Networks for User Response Prediction
作者:Yi Yang, Baile Xu, Furao Shen, Jian Zhao;
論文:t.cn/AiO2Dp5k;代碼:t.cn/Ev4H3Jm;
深度CTR預(yù)估新積木:PNN + FFM – FM = ONN模型,效果好于DeepFM和PNN。
18. BERT4Rec: Sequential Recommendation with Bidirectional Encoder Representations from Transformer, Alibaba
作者:Fei Sun, Jun Liu, Jian Wu, Changhua Pei, Xiao Lin, Wenwu Ou, Peng Jiang;
論文:t.cn/AiNqPitA;
Transformer引入推薦系統(tǒng)工業(yè)界,利用用戶歷史點(diǎn)擊序列預(yù)測(cè)下一個(gè)點(diǎn)擊item,效果超過(guò)GRU4Rec。
19. A Capsule Network for Recommendation and Explaining What You Like and Dislike, SIGIR2019, Alibaba
作者:henliang Li, Cong Quan, Li Peng, Yunwei Qi, Yuming Deng, Libing Wu;
論文:t.cn/AiOLWp6x;
阿里 at SIGIR2019,膠囊神經(jīng)網(wǎng)絡(luò)應(yīng)用于推薦提出CARP模型來(lái)從評(píng)論中更好地建模用戶對(duì)商品的喜好程度,效果好于最新的ANR等。
20. Representation Learning-Assisted Click-Through Rate Prediction, IJCAI 2019, Alibaba
作者:Wentao Ouyang, Xiuwu Zhang, Shukui Ren, Chao Qi, Zhaojie Liu, Yanlong Du;
論文:t.cn/Ai0jcGIZ;代碼:t.cn/Ai0jcGIw;
阿里 at IJCAI2019,提出DeepMCP模型通過(guò)匹配、關(guān)聯(lián)、預(yù)測(cè)三個(gè)子模塊更好地建模用戶-ad,ad之間以及特征-CTR關(guān)系,效果優(yōu)于DeepFM并開(kāi)源了代碼。
拓展知識(shí):
原創(chuàng)文章,作者:九賢生活小編,如若轉(zhuǎn)載,請(qǐng)注明出處:http:///108150.html