携程人工智能实践
  • 推荐0
  • 收藏0
  • 浏览42

携程人工智能实践

携程计算机技术(上海)有限公司 (作者) 

  • 书  号:978-7-121-38440-0
  • 出版日期:2020-04-01
  • 页  数:320
  • 开  本:16(170*240)
  • 出版状态:上市销售
  • 维护人:张慧敏
本书的作者来自携程多个研发部门,从具体的应用场景入手,主要包括旅行产品的个性化推荐和搜索,旅行场景的 OCR、机器翻译和知识图谱,主题图片优选、推荐理由抽取,以
及安全风险控制和如何工程化提升研发效率等,较为全面地介绍了如何对具体的业务问题进行建模,将其转变为具体的机器学习模型,并将业务目标转化为机器学习的目标函数。本书在此基础上提供了一些有效的经验,使得读者能够最大化利用机器学习的方式全面有效地帮助企业提升业务目标、提升人效比,乃至为网站的安全保驾护航。作者希望本书能够帮助产品技术同人更好地理解机器学习模型的落地,给读者带来启发和借鉴。
携程集团执行副总裁张晨力荐,携程技术团队多年开发应用人工智能技术的结晶,选取真实技术案例,深入探索人工智能技术落地方案
携程技术团队
作为携程集团的核心竞争力,携程技术团队由近7000位来自海内外的精英工程师组成,为携程集团业务的运作和开拓提供全面技术支持,并以技术创新源源不断地为产品和服务创造价值。
技术从来都不是闭门造车,携程技术团队会一直以开放和充满热情的心态,通过各种渠道和方式,和圈内小伙伴们探讨、交流、碰撞,共同收获和成长。




前 言
近年来,得益于深度学习和硬件计算能力的快速发展,人工智能技术正快速渗透到互联网应用的方方面面,这样的变化同样也伴随着携程产品技术的迭代更新。人工智能技术不仅直接提升了携程的订单收入、用户满意度等关键产品指标,还在业务运营、内容生产、信息安全与风险控制等方面发挥了重要作用。
携程作为OTA 领域的领军企业,积累了大量的用户出行场景数据、客服场景咨询与沟通数据、产品相关内容数据等,这些数据在机器学习模型的训练中发挥了巨大的作用。另外,携程有足够多的复杂场景,这些真实的复杂场景催生并推动了人工智能在携程中的广泛应用。同时,携程的产品线丰富且分支较多,因此将人工智能服务化和中台化成为必不可少的模块,它会对共性需求进行收口,以通用服务/ 中台的形式提供服务,有效降低部门之间的重复工作,节省开发成本,缩短开发周期。
与传统的人工智能书籍不同,本书更加关注如何将具体业务场景的问题分析和模型建模转化为具体的机器学习和深度学习问题,同时对于复杂业务场景,详细阐述了对应的算法架构体系,也介绍了如何更好地拟合各种业务指标,如自主率、点击率、人效比、网站的安全性等,最大限度地对业务进行赋能。作者希望通过具体的实践案例,给读者带来启发和借鉴。
作者介绍了OTA 场景在落地时的一些差异性问题,帮助用户理解在不同应用场景中可能遇到的一些差异性问题。例如,由于旅游产品的非标属性,用户在决策之前非常依赖内容化信息,因此携程在AI 内容化方面做了大量的工作和实践,帮助用户减少决策前的费力度;在同一酒店,不同的供应商和房型具有入住政策、软硬件设施和价格的差异,个性化推荐的召回池不是酒店实体,而是更加细分的入住政策、服务和设施,这些是入住体验的关键影响因素。
本书的内容安排如下。
第1 章和第2 章介绍了人工智能的一些基础原理,包括数学基础和模型构建,使读者快速回顾和了解算法中的一些基础内容,加深对后续章节中的技术细节的理解。
第3 章介绍了个性化推荐与搜索,如冷启动、个性化搜索、酒店排序、瀑布流排序等方面的实践,具体阐述如何利用算法为用户提供更好的优质服务。
第4 章介绍了携程在AI 服务化方面的工作,从旅游领域知识图谱、QA 问答、机器翻译和证件全文本识别四个方向进行详细阐述,这些方向都能够带给用户更好的服务体验、更细致的产品细节、更快速的问题解答、国际化的畅通体验和更便捷的操作服务。
第5 章和第6 章介绍了AI 如何有效提高工作人员在相关场景中的运营工作效率,从内容产品化、房态预测、用户模拟评分、邮件自动化、实时智能异常检测等多个方面进行了具体介绍,有效地发现了业务趋势和问题,并在一定条件下进行了自动处理。
第7 章和第8 章介绍了AI 在信息安全和风险控制方面的一些具体应用,详细阐述了对应的难点、目标和解决方案。
第9 ~ 11 章介绍了在AI 中台化方面的实践——AI 挖掘中台、AI 运营中台和通用数据服务,说明了在中台化建设中如何进行业务架构和系统架构规划。
本书面向的读者主要是人工智能领域的从业人员,包括产品和技术同人,同时也欢迎从事其他岗位和行业的读者通过阅读本书,对人工智能的原理和应用有一定的了解,一起探索和拓展人工智能的应用落地。对于想要入门的算法同人,建议详细阅读数学基础和模型构建章节,以便能够更好地结合理论和实践。没有相关数学知识背景或仅仅对具体应用场景感兴趣的同人,可以跳过数学基础和模型构建的内容。
感谢参与本书写作的来自携程的同人,他们将工作中的宝贵经验进行提炼和总结,并形成知识体系分享给读者。感谢出版社的工作人员,在本书的出版过程中给予的帮助和支持。
《携程人工智能实践》编委会

目录

目 录
第1 章 数学基础 001
1.1 引言 001
1.2 线性代数 001
1.2.1 概述 001
1.2.2 向量与矩阵 002
1.2.3 矩阵的运算 003
1.2.4 几种特殊的矩阵 005
1.2.5 线性方程组与矩阵的逆 007
1.2.6 特征值和特征向量 010
1.2.7 张量的定义和运算 011
1.3 概率基础 013
1.3.1 频率与概率 013
1.3.2 熵 016
1.3.3 常见的概率分布 017
1.4 优化理论 020
1.4.1 优化理论简介 020
1.4.2 无约束的优化问题 022
1.4.3 无约束的优化方法 024
1.4.4 风险函数的优化方法 026
1.4.5 带约束的优化方法 028
1.5 本章小结 031
参考文献 031

第2 章 模型构建 032
2.1 引言 032
2.2 建模流程 032
2.2.1 目标定义 032
2.2.2 损失函数 035
2.2.3 求解优化 037
2.2.4 结果评估 037
2.2.5 模型选择 040
2.3 常见模型 042
2.3.1 模型的分类方法 042
2.3.2 回归模型 043
2.3.3 逻辑回归模型 047
2.4 集成学习 049
2.4.1 集成学习概述 049
2.4.2 Bagging 051
2.4.3 Boosting 052
2.5 本章小结 055
参考文献 057

第3 章 个性化推荐与搜索 058
3.1 个性化推荐概述 058
3.2 跨领域推荐改善用户冷启动问题 059
3.2.1 背景描述 059
3.2.2 基础定义 060
3.2.3 建模思路 061
3.2.4 模型结构 062
3.2.5 实验结果 065
3.3 Bandit 算法在携程场景中的应用实践 066
3.3.1 Context-free Bandit 算法 067
3.3.2 Contextual Bandit 算法 069
3.3.3 场景应用 070
3.4 旅游度假产品的搜索个性化排序 078
3.4.1 度假搜索排序框架 079
3.4.2 度假搜索排序算法 080
3.4.3 模型演进及其他 085
3.4.4 小结 086
3.5 深度学习在酒店房型推荐中的应用实践 087
3.5.1 酒店房型推荐业务的背景 087
3.5.2 业务问题转化为算法问题 087
3.5.3 算法流程 088
3.5.4 小结 089
3.6 强化学习在酒店排序中的应用实践 089
3.6.1 业务背景 089
3.6.2 传统排序学习的局限性 090
3.6.3 强化学习的基本思路 091
3.6.4 算法流程 091
3.6.5 小结 093
3.7 瀑布流排序算法实践 094
3.7.1 场景简介 094
3.7.2 优化目标 094
3.7.3 特征工程 095
3.7.4 模型 097
3.7.5 位置偏差 098
3.7.6 评价指标 099
3.7.7 场景实践 101
3.8 本章小结 101

第4 章 AI 服务化 102
4.1 AI 服务化的背景与难点 102
4.2 旅游领域知识图谱 102
4.2.1 旅游领域知识图谱的特点 103
4.2.2 旅游领域知识图谱的构建 104
4.2.3 旅游领域知识图谱的应用 112
4.3 QA 问答中的文本匹配与排序 117
4.3.1 基于深度学习的语义匹配模型 118
4.3.2 基于交互的语义匹配模型 122
4.3.3 迁移学习在语义匹配网络中的应用 125
4.3.4 对语义匹配模型的一些思考 127
4.4 携程国际化中的机器翻译 130
4.4.1 模型架构 130
4.4.2 建模技巧 135
4.4.3 翻译质量评估 138
4.5 证件全文本识别 141
4.5.1 文本识别简介与发展历程 141
4.5.2 文本识别步骤 142
4.5.3 文本检测 142
4.5.4 文本识别 145
4.5.5 文本识别在证件识别中的应用实践 145
4.6 本章小结 147
参考文献 147

第5 章 AI 助力产品运营 150
5.1 旅游场景中的主题图片自动优选 151
5.1.1 业务场景 151
5.1.2 图像识别 151
5.1.3 图像去重 154
5.1.4 图像优美度识别 155
5.1.5 小结 158
5.2 知识推理在携程业务中的应用 158
5.2.1 标签系统的业务背景和业务痛点 159
5.2.2 标签规则配置平台的设计与实现 160
5.2.3 小结 164
5.3 基于专名的内容产品化 165
5.3.1 内容产品化的业务背景 165
5.3.2 命名实体识别 165
5.3.3 实体链接 168
5.3.4 小结 174
5.4 主题推荐理由抽取 174
5.4.1 主题推荐理由抽取的业务背景 174
5.4.2 智能内容抽取 175
5.4.3 自动内容生成 186
5.4.4 小结 193
5.5 本章小结 194
参考文献 194

第6 章 AI 运营 199
6.1 问题的背景与难点 199
6.2 机器学习在海外酒店房态预测中的运用 201
6.2.1 业务背景 201
6.2.2 海外酒店房态预测的难点 201
6.2.3 海外酒店房态预测难点的解决方案 202
6.2.4 海外酒店房态预测的应用场景 208
6.3 IM+ 用户模拟评分 209
6.3.1 业务背景 209
6.3.2 基于深度学习的模拟评分 210
6.3.3 技术方案流程 214
6.4 海外邮件自动化 215
6.4.1 业务背景 215
6.4.2 自然语言处理在邮件自动化中的应用 216
6.5 实时智能异常检测平台的算法及工程实现 221
6.5.1 应用场景 221
6.5.2 大而全的监控衍生出的问题 222
6.5.3 统计模型的困扰 222
6.5.4 算法选择和设计目标 223
6.5.5 算法的描述和检验 225
6.5.6 实时性工程 231
6.6 本章小结 233

第7 章 信息安全 234
7.1 问题的背景与难点 235
7.2 机器学习在Web 攻击检测中的实践 235
7.2.1 携程Web-IDS 攻击检测系统架构介绍 235
7.2.2 定义目标问题 238
7.2.3 收集数据和实现特征工程 238
7.2.4 模型效果评估 240
7.2.5 线上应用和持续优化 241
7.3 机器学习在滑块验证码防御中的实践 242
7.3.1 滑块验证码人机识别 243
7.3.2 滑块验证码轨迹相似度识别 247
7.4 本章小结 253
参考文献 253

第8 章 风险控制 254
8.1 自动化迭代反欺诈模型体系 254
8.1.1 风控变量体系 256
8.1.2 自动化迭代模型框架 256
8.1.3 RNN 表征学习 259
8.1.4 自动化与传统方法的效果对比 261
8.2 “程信分”模型体系 263
8.2.1 “程信分”模型 263
8.2.2 “闪住”催收模型 266
8.3 主动学习在业务风控场景中的应用 268
8.3.1 酒店反刷单主动学习模型 268
8.3.2 机票防虚占主动学习模型 271
8.4 本章小结 273
参考文献 273

第9 章 AI 挖掘中台 274
9.1 AI 挖掘中台的背景 274
9.2 AI 挖掘中台的框架和功能 275
9.2.1 AI 挖掘中台的构成 275
9.2.2 AI 挖掘操作步骤 276
9.2.3 AI 挖掘中台的组件及工作流程 279
9.2.4 AI 挖掘中台应用成效 281
9.3 大数据和人工智能的赋能 281
9.4 本章小结 282

第10 章 AI 运营中台 283
10.1 AI 运营中台的背景 283
10.2 AI 运营中台的框架和功能 284
10.2.1 框架 284
10.2.2 流程 288
10.2.3 模块 289
10.3 AI 运营中台的高效运营 290
10.3.1 AI 赋能方式 290
10.3.2 企业应用实例 291
10.4 本章小结 292

第11 章 通用数据服务 294
11.1 通用数据服务的背景 294
11.2 通用数据服务平台的架构和功能 295
11.2.1 通用数据服务平台的架构 295
11.2.2 通用数据服务平台的功能模块 295
11.3 通用数据服务的监控 299
11.3.1 存储监控 300
11.3.2 查询监控 300
11.3.3 写入监控 301
11.4 本章小结 302

读者评论