文末送书!大语言模型应用指南:以ChatGPT为起点,从入门到精通的实践教程



万俊 著

电子工业出版社-博文视点 2024-05-019787121475986 定价: 118.00 元


新书推荐

🌟今日福利



关于本书



本书是一本对人工智能小白读者非常友好的大语言模型应用指南,有两大特点:一是以通俗易懂的方式解释复杂概念,通过实例和案例讲解大语言模型的工作原理和工作流程、基本使用方法,包括大语言模型常用的三种交互格式、提示工程、工作记忆与长短期记忆,以及外部工具等,使读者能够全面了解和掌握这一先进技术的应用和二次开发;二是紧跟当前大语言模型技术的更新动态,介绍GPTs的创建,以GPT-4V和Gemini为例讲述多模态模型的应用,还包括无梯度优化、自主Agent系统、大语言模型微调、RAG框架微调、大语言模型安全技术等。


无论是学术研究者、工程师,还是对大语言模型感兴趣的普通读者,都可以通过本书获得大语言模型的前沿研究成果、技术进展和应用案例,从而更好地应用大语言模型解决实际问题。



关于作者



万俊,南京大学计算数学专业本硕;现任中国香港瑞银软件工程师;OPPO前高级数据挖掘工程师 ;蚂蚁集团前高级机器学习、数据工程师 ;Udacity前机器学习和深度学习资深讲师;曾多次在各类数据竞赛中获奖(Kaggle Kesci Data Castle);已发表CCF A类论文一篇,EI论文一篇,神经网络测试专利一个 ;LeetCode专栏作家,著有“Enlighten AI”专栏。



 限时5折,点击购书  



未来,大语言模型极有可能发展到与当前计算机操作系统的地位相当,因此,应用大语言模型可以说是每个人不可或缺的技能。

《大语言模型应用指南:以ChatGPT为起点,从入门到精通的AI实践教程(全彩)》一书将帮助大家更好地理解和使用大语言模型,即使你对人工智能技术或编程技术一窍不通,也不用担心。本书将用通俗易懂的语言和例子,讲述大语言模型的基本原理、基础使用方法和进阶开发技巧。




本书特色

  • 一是以通俗易懂的方式解释复杂概念,通过实例和案例讲解大语言模型的工作原理和工作流程、基本使用方法,包括大语言模型常用的三种交互格式、提示工程、工作记忆与长短期记忆,以及外部工具等,使读者能够全面了解和掌握这一先进技术的应用和二次开发;
  • 二是紧跟当前大语言模型技术的更新动态,介绍GPTs的创建,以GPT-4V和Gemini为例讲述多模态模型的应用,还包括无梯度优化、自主Agent系统、大语言模型微调、RAG框架微调、大语言模型安全技术等。

无论是学术研究者、工程师,还是对大语言模型感兴趣的普通读者,都可以通过本书获得大语言模型的前沿研究成果、技术进展和应用案例,从而更好地应用大语言模型解决实际问题。




本书主要内容

本书的读者对象是大语言模型的使用者和应用开发者,全书共分为4篇。
  • 第1篇讲述机器学习、神经网络的基本概念,自然语言处理的发展历程,以及大语言模型的基本原理。鉴于本书的重点在于大语言模型的应用和二次开发,因此本书将不涉及大语言模型的训练细节。然而,我们仍强烈建议读者熟悉每个关键术语的含义,并了解大语言模型的工作流程,以更好地理解后面的内容。

  • 第2篇讲述大语言模型的基础应用技巧。首先,介绍大语言模型常用的3种交互格式。随后,深入讲解提示工程、工作记忆与长短期记忆,以及外部工具等与大语言模型使用相关的概念。最后,对大语言模型生态系统中的关键参与者——ChatGPT的接口与扩展功能进行详解。

  • 第3篇讲述大语言模型的进阶应用技巧。首先,介绍如何将大语言模型应用于无梯度优化,从而拓宽大语言模型的应用领域。随后,详细讨论各类基于大语言模型的自主Agent系统,以及微调的基本原理。最后,介绍与大语言模型相关的安全技术。

  • 第4篇讲述大语言模型的未来。一方面,探讨大语言模型的生态系统和前景,简要介绍多模态大语言模型和相关的提示工程。另一方面,深入解析大语言模型的尺度定律,并尝试从无损压缩的角度来解析大语言模型具备智能的原因,最后以图灵机与大语言模型的联系作为全书的结尾。




PaperWeekly携手博文视点送书啦!

在本文评论区留言+点赞

我们将随机抽取10位读者

包邮送出这本大语言模型重磅新书

活动截止时间为5月17日 12:00

届时请留意后台消息



 限时5折,点击购书  




🔍
现在,在「知乎」也能找到我们了进入知乎首页搜索「PaperWeekly」点击「关注」订阅我们的专栏吧



······



相关推荐

  • 【毕业论文】求解最优的任意宝可梦颜色交换算法
  • 到底该不该上APS?
  • 1.6K Star专业小巧!只有10M的录屏软件,Mac可用
  • 绿联,你人还怪好嘞
  • 一文读懂多家厂商的大模型训练、推理、部署策略
  • 中国人有鸿蒙,凭什么要用美国的安卓?
  • 大模型产研2024年4月半月谈后的一些冷思考:思辨及从关键事件、RAG-KG结合到文档图表理解的一些跟进
  • 每日大模型&RAG&文档智能&知识图谱进展及月度线上交流:老刘说NLP技术社区对外纳新
  • 今日arXiv最热NLP大模型论文:揭露大语言模型短板,北京大学提出事件推理测试基准
  • 清华发布Temporal Scaling Law,解释时间尺度对大模型表现的影响
  • 真要这么卷?某国产大模型定价下调90%,百万 tokens 只需 1 元!
  • 终于知道工资为什么要保密了。
  • 何恺明目前的学术成果是否够得上计算机视觉领域历史第一人?
  • 深度学习模型加速:Pytorch模型转TensorRT模型
  • 大学教师,降薪了
  • 【小象AI第9讲】5月13日,自然语言处理NLP入门:词向量
  • 成都周报丨规模15亿,四川首支S基金设立
  • 解锁Spring Security6:核心安全机制
  • 独家资料下载:《大模型推荐系统》
  • 微信成对数据AB实验探索