推荐系统技术作为近年来非常热门的AI技术,已广泛应用于互联网各行业,从衣食住行到娱乐消费,以及无处不在的广告,背后都依赖推荐系统的决策。本书贴合工业级推荐系统,以推荐系统的整体技术框架为切入点,深入剖析推荐系统中的内容理解、用户画像、召回、排序、重排等核心模块,介绍每个模块的核心技术和业界应用,并展开介绍了推荐冷启动、推荐偏差与消偏等常见问题和解决方案。此外,还对当前推荐系统领域的热门前沿技术进行了介绍,包括强化学习、因果推断、端上智能等。
《这就是推荐系统——核心技术原理与企业应用》既适合推荐系统、计算广告及搜索领域的互联网相关从业人员,也适合高等院校人工智能、计算机技术、软件工程等专业的本科生、研究生及博士生,以及对推荐系统感兴趣的爱好者等,可以帮助他们了解工业级推荐系统的基础框架、核心技术和前沿发展。
TikTok、快手、微信看一看等多个大规模工业级推荐系统的核心研发经验总结,内容按实际推荐系统模块划分:内容理解、用户画像、召回、排序、重排等,作者来自一线大厂
胡澜涛
毕业于清华大学计算机系,快手推荐算法技术总监。曾任字节跳动高级算法工程师,腾讯高级研究员。在推荐系统领域有丰富的实践经验,负责过包括TikTok、快手、微信看一看在内的多个大规模工业级推荐系统的核心研发工作。主要研究方向为推荐系统,发表相关领域的学术论文6篇,拥有专利5项。
李玥亭
毕业于大连理工大学计算机专业。曾先后就职于百度、小米等公司,参与百度凤巢广告CTR预估模型的研发,负责小米音乐、阅读、应用商店、游戏中心等多个产品推荐服务从0到1的搭建,在搜索、广告、推荐领域有丰富的实战经验。目前转战智能家居领域,探索智能感知、智能决策等AI技术在新场景的落地。
崔光范
毕业于中国科学院软件研究所,爱奇艺助理研究员,负责短视频信息流推荐业务。曾任小米推荐算法工程师,负责应用商店、游戏中心、有品等业务的推荐工作,从零构建了小米垂域业务的深度推荐引擎。主要研究方向是推荐系统、计算广告、搜索等,发表过多篇论文和专利。
易可欣
毕业于北京大学,先后在爱奇艺、快手担任推荐算法工程师,主要研究方向为召回策略与模型、数据挖掘、样本优化等。
前言
互联网及移动互联网的迅速发展颠覆了整个世界,层出不穷的互联网服务改变了人们获取信息的途径。为了提高信息的匹配效率,推荐系统应运而生,现在已经是互联网应用的标配。在移动互联网和互联网信息平台日益繁荣的今天,推荐系统发挥着无可替代的重要作用。就让我们顺应智能推荐的大趋势,去探索推荐技术的发展和变革吧!
本书的特色
推荐系统是一个以应用为主的领域,本书的初衷是让更多的人清晰、完整地了解推荐系统,以及各项推荐技术出现和演化的因与果。本书以从业者的视角,从推荐系统的整体框架技术出发,逐步深入各个核心技术模块和关键问题分支,介绍工业级推荐系统涉及的方方面面。
本书结合工业级推荐系统对功能模块及人员的组织分工,将推荐系统分为内容理解、用户画像、召回、粗排、精排和重排等核心模块。对于每个核心模块,阐述其在推荐系统中的作用和主流技术选型路线,详细介绍模块中的核心算法和策略,深入讨论各项技术被提出的原因和对应解决的问题。此外,本书还结合实际产品中的业务问题,给出了一些通用的优化策略和技巧。
本书的读者对象
本书的读者对象分为以下两类。
一类是互联网行业相关的从业人员,特别是推荐系统、计算广告、搜索领域的技术、产品或者运营人员等。对多数互联网公司来说,推荐系统是产品信息触达用户的主要途径之一。希望通过本书可以帮助读者熟悉推荐系统的全貌,厘清每个关键模块和核心技术,构建推荐业务的思维框架和知识体系,进而将这些内容融会贯通在实际的生产过程中。
另一类是包括高等院校人工智能、计算机技术、软件工程等专业的本科生、研究生及博士生,以及对个性化推荐、大数据应用感兴趣,希望进入推荐系统领域的爱好者等。本书尽量深入浅出,从整体出发再深入细节,介绍推荐系统技术的相关原理和应用方法,使读者可以从零开始构建实用的推荐系统知识体系。
本书的内容结构
本书的内容大体可以分为如下四个部分。
第1部分(第1章):鸟瞰推荐系统全貌,阐述推荐系统的定义、价值及时代的红利,概览工业级推荐系统的整体结构和核心功能模块。
第2部分(第2章至第6章):剖析推荐系统的核心模块。深入推荐系统中的内容理解、用户画像、召回、排序及重排模块内部,介绍每个核心模块的作用及关键技术应用。
第3部分(第7章至第9章):讲解推荐系统中的其他关键技术和问题。介绍支撑推荐系统的特征工程、样本挖掘、推荐系统实效性、AB实验平台等技术;探讨推荐系统都会面临的冷启动问题和推荐偏差问题,并结合业务应用给出一些通用的解决方案。
第4部分(第10章):追踪推荐系统中的前沿技术。探讨目前的一些热门前沿技术在推荐系统中的应用,包括强化学习、因果推断、端上智能、动态算力分配,以及ChatGPT时代推荐系统的未来等。
如何使用本书
本书并不要求读者必须具备深度学习或者机器学习的背景知识。对于没有相关知识背景的读者,可以通过阅读本书来了解推荐系统的全息全貌;对于有相关知识背景的读者,也可以针对学习和工作中的实际问题翻阅相应的章节,深入每个模块的技术细节。
对于推荐系统的初学者,建议从第1章开始按顺序阅读本书。对于有一定推荐领域经验的读者,可以直接翻阅感兴趣的章节进行阅读。由于篇幅限制,有些内容的背景知识或细节无法全面展开,感兴趣的读者可以查阅相应的参考文献。
联系作者
推荐系统技术发展快,内容精深,书中存在错误在所难免,敬请读者谅解。如果你对本书有任何疑问或建议,都可以发送邮件至airecsystem@gmail.com。希望你读完本书能有所收获。Enjoy!