这本书专门为那些对自然语言处理技术感兴趣的读者提供了系统的LLM应用开发指南。全书分为11章,从LLM基础知识开始,通过LangChain这个开源框架为读者解读整个LLM应用开发流程。第1~2章概述LLM技术的发展背景和LangChain框架的设计理念。从第3章开始,分章深入介绍LangChain的6大模块,包括模型I/O、数据增强、链、记忆等,通过大量代码示例让读者了解其原理和用法。第9章通过构建PDF问答程序,帮助读者将之前学习的知识应用于实践。第10章则介绍集成,可拓宽LangChain的用途。第11章为初学者简要解析LLM的基础理论,如Transformer模型等。
《LangChain入门指南:构建高可复用、可扩展的LLM应用程序》以LangChain这个让人熟悉的框架为主线,引导读者一步一步掌握LLM应用开发流程,适合对大语言模型感兴趣的开发者、AI应用程序开发者阅读。
全面介绍LangChain技术;逐步构建自己的LLM应用程序;内容注重高可复用性和可扩展性;实用案例和示例代码助你快速上手;与社区互动,共享经验与解决难题
李特丽,LangChain中文网联合创始人,优秀的软件工程师。曾翻译LangChain、OpenAi、Milvus等AI开发三件套的中文文档,帮助中国开发者快速上手AI开发。
康轶文,LangChain中文网创始人,2005年从个人站长做起,成为第一代SEO“大神”;2012年转型移动互联网营销,成为中国Apple Ads代理商,获得苹果千万美元授信;2022年转型月付制AI数字员工全托管服务,是一位经验丰富的数字员工和人工智能应用专家。
2023 年,LLM(大语言模型)井喷式爆发,尤其是GPT-4 问世,一石激起千层浪,影响了整个人工智能领域,每个开发者都被“裹挟”着进入了LLM 应用开发时代。在这样的大背景下,LangChain 这个以LLM 为核心的开发框架应运而生,进一步推动了这一领域的创新和发展。LangChain 不仅可以用于开发聊天机器人,还能构建智能问答系统等多种应用,这马上引起了广大技术爱好者和开发者的关注。不同于其他传统的工具或库,LangChain 提供了一个完整的生态系统,为开发者带来了一系列强大的功能和工具,从而简化了 LLM 开发的复杂性。值得一提的是,LangChain 的社区正在迅速壮大。随着越来越多的开发者和组织选择使用LangChain 进行项目开发,一个活跃的社区生态将逐渐形成。正是在这一波LLM 开发热潮的推动下,越来越多的人对如何有效利用这些先进的技术产生了浓厚的兴趣。因此,本书的出现恰逢其时。本书旨在为读者提供全面且深入的LLM 开发指南,特别是在LangChain 框架的应用和实践方面。全书共分11 章,内容涵盖从LLM 基础知识到高级应用技巧的方方面面。
第1 章:为读者介绍LLM 开发的整体背景,同时详细探讨LangChain 在LLM 领域的独特定位和关键作用。
第2 章:深入介绍LangChain 的基础知识,包括其背后的设计动机、核心概念,以及可能的应用场景。
第3 章至第8 章:这几章是本书的核心,详细解读了LangChain 的6 大模块。从模型I/O、数据增强,到链、记忆、Agent 的定义及应用,再到如何有效使用回调处理器,都为读者提供了丰富的实践技巧和指导。
第9 章:展示如何利用LangChain 构建真实的应用程序,例如PDF 问答程序,帮助读者将理论知识转化为实际应用。
第10 章:探索如何将LangChain 与其他外部工具和生态系统进行集成,为开发LangChain 入门指南构建高可复用、可扩展的LLM 应用程序者提供更广泛的应用场景和解决方案。
第11 章:简单解释LLM 的基础知识,包括Transformer 模型、语义搜索、NLP与机器学习基础。
同时,本书是为那些对LLM 应用开发充满热情的读者而写的,特别是那些初探LLM 应用开发领域的初级程序员,以及对LangChain 抱有浓厚兴趣的技术爱好者。为了确保你能够顺利地跟随本书的内容,建议你至少具备基础的Python 编程知识。但即使你对Python 不太熟悉,也完全没有关系。得益于GPT-4 的强大能力,你可以在学
习的过程中实时编程和练习。
LangChain 目前有两个语言版本——Python 和JavaScript,这无疑利好前端开发工程师,不会Python 也能快速上手LLM 应用开发。当然,在GPT-4 的加持下,即使不会Python 和JavaScrip,依然可以学会LangChain。本书中的所有示例代码都基于Python版本。
需要特别指出的是,本书中的所有示例代码都是基于OpenAI 平台的模型编写的,而不涉及模型的实际训练。因此,你无须拥有高性能的计算机就可以轻松运行这些代码。为了方便读者学习和实践,我们已经将所有的示例代码上传到了 GitHub 仓库,你可以随时下载并在自己的计算机上运行。为了更加高效地运行和调试代码,建议你使用VSCode 这样的代码编辑器,并确保你的计算机上已经安装了Python 运行环境。如果你更喜欢交互式的编程环境,Jupyter Notebook 也是一个很好的选择,它特别适合进行LangChain 学习。技术的进步往往不是一蹴而就的,技术的进步在于一点一滴的积累。这个过程更像一滴滴水珠汇聚成河流,最终汇入大海。这本书虽然只是LLM 开发领域的一个微小部分,但它代表了我们对这个领域的热情和对知识的追求。
LangChain 框架目前仍处在从V.0.300+向V.1.0 稳步前进的过程中。7000 多个issue反映出它的不完美,但同时也展现出了一个充满活力、持续进化的生态。这些都在见证这颗小树苗如何茁壮成长。
最后,希望这本书能为你在LLM 应用领域的学习带来一些帮助,让你在LLM 开发的道路上走得更稳、更远。