整理 | 王启隆出品 | AI 科技大本营(ID:rgznai100) 最近,Anthropic 的 Claude 在全球的 AI 社区声势浩大。一方面是 OpenAI 放了太久的鸽子,在年初发布 Sora 和 GPT-4o 之后一直藏着捏着,而 CEO Sam Altman 则减少了发言量,各类活动都推 CTO Mira Murati 到台前受访。Murati 也不是省油的灯,一直不透露 Sora 的发布日期,更是在近期的一场活动中围绕下一代 GPT 的问题连续回复了三次“我不知道”:主持人:连你都不知道?(详见文章链接)
而另一方面,就单纯是因为最新的 Claude 3.5 Sonnet 太好用了,许多国外开发者对其赞不绝口。在这段时间,Anthropic 赶着这个势头,更新频率异常之快,除了前段时间更新了 Artifacts 的分享功能,还在今天正式放出了最大输出为 8K Token 的模型:「max-tokens-3-5-sonnet-2024-07-15」。这意味着可以使用 Claude 3.5 Sonnet 输出更长的文章或者编写更复杂的 Artifacts。
目前只需要在 Claude API 中更换 header 和 max_tokens 即可,或者是在 Anthropic Console 中进行测试。
底下的开发者也都非常兴奋,纷纷表示这可以改变 AI 生成代码的游戏规则。
Claude 系列模型最新的这个「Artifacts」功能,究竟为什么能被全球开发者吹得神乎其技?为此,我们也搞来了免费版的 Claude 3.5 Sonnet,打算亲自试一试。
所谓 Artifacts,就是指在我们熟悉的聊天窗口右边再多加一个特殊的窗口,这个窗口会在你用 AI 进行代码生成的时候展示代码,生成结束后还能将代码渲染成网页。
比方说,我们先让 Claude 创建一个 AI 新闻网站,他不会像 ChatGPT 那样直接在聊天对话框直接开始生成大量的代码,而是在右边的 Artifacts 窗口里进行工作:
最后,Claude 可以直接把后续工作也一起完成,直接在 Artifacts 窗口提供了一个我想要的新闻网页:
当然,由于我的 Prompt 非常简陋,它生成的网页自然也很难看。而 Claude 也自行猜测了我的下一步建议,并询问我要不要进一步改善网页,比如添加更多的新闻文章和内容、改进网站的设计和样式、添加动态功能(如新闻订阅、评论系统),或是考虑使用内容管理系统(CMS)来更方便地管理网站内容等等。
于是,我直接复制粘贴了 Claude 提供的建议,让它进一步改善代码:
现在这个样子,相比最开始那种黑白色是好看多了。如果我们进一步要求 Claude,他就会开始将其视为复杂的项目,并分前后端的实现进行讨论,相当专业 —— 当然,这就需要更长的上下文,所以今天才有开发者说,8K Token 是「改变了 AI 生成代码的游戏规则」。
而随着 Artifacts 开放了分享功能,大家现在可以复制别人的 Artifacts 链接,直接拿到自己的 Claude 网页端上进行复现。比方说,我刚刚从头到尾只想了第一句话,剩下全部交给 Claude 完成的这个网页,就能直接变成链接打开:
在开发者社区,现在还有非常多的有趣 Artifacts 用例,比方说,下面这位开发者直接靠 Claude 搓出了一个魔方程序:
Artifacts 链接:https://claude.site/artifacts/0a4a1e14-85d8-4169-b251-6ceebda740cb
或者是由日本开发者制作的这款小游戏《Flappy Chicken》:
Artifacts 链接:https://claude.site/artifacts/0e67b4a8-c21e-40f6-a40f-3a031b46501f
看到这可能有人要问,这些小网页和小游戏,不是 GPT-4 早就能做到的吗?
没错,但 Anthropic 的聪明之处就在于,他们不止甘心于「做到」,还让用户能「看到」。Artifacts 会出现聊天界面旁边,这样你能够实时查看、迭代和创建自己的作品,因此 Claude 事实上是从普遍意义上的对话机器人进化为协作式工作环境。
Artifacts 最终代表着一个方向,它能让编程小白首先享受到生成应用的乐趣,而不是卡在部署代码这一步碰壁。在《打破焦虑!AI 时代的程序员为什么需要云端 IDE?》一文中,资深程序员天猪老师就表示 Artifacts 的特色在于将代码执行过程可视化,引入了双向交互机制。传统的代码解释器仅负责代码执行,无法直观观察执行细节,而 Artifacts 额外提供了交互层,使得代码执行和结果展示过程变得生动直观,极大提升了用户体验。
不过,以上的例子都还属于玩票性质,对于程序员来说,究竟要怎么把 Artifacts 应用到自己的实际开发过程呢?事实上,今天还有一则新闻,便是 Claude Engineer 2.0 的正式发布和开源。这是 EverArt AI 创始人 Pietro Schirano 操刀的一个开源项目,目前为止已经在 GitHub 斩获了 3.2k 的 Stars。
项目链接:https://github.com/Doriandarko/claude-engineer
Pietro Schirano(左一)在 GPT-4o 发布当晚的现场
想象一下,如果能在命令行整合 Claude 3.5 Sonnet,一边生成 Artifacts,一边结合图片,然后让人类干预操作修改整个项目代码,最终完成一个生产级别的项目,会是一种怎么样的体验?
这就是 Claude Engineer 的最初理念:打造一款先进的交互式命令行界面(CLI),利用 Claude 3 和 Claude 3.5 模型的强大功能来协助完成各种软件开发任务。这款开源工具将最先进的大型语言模型的功能与实用的文件系统操作、网络搜索功能、智能代码分析和执行功能完美地结合在一起。
先来个视频,看看这个开源项目到底是做啥的:
这次重大更新引入了代码编辑器、代码执行代理以及动态编辑等革命性功能,大幅提升了开发者的工作效率。下面,让我们深入了解这款强大工具的核心特性和使用体验:
智能代码编辑与执行
Claude Engineer 2.0 最引人注目的特性之一是其智能代码编辑和执行能力。在处理大型文件时,Engineer 会指挥编码代理,根据文件复杂度智能地分批提供修改建议。这种方法不仅提高了效率,还确保了修改的准确性和连贯性。
与此同时,代码执行代理能够运行代码并检查潜在问题。它甚至可以启动和终止进程,比如实时服务器,这对于 Web 开发者来说是一个极其有用的功能。这种智能化的代码管理和执行方式,极大地简化了开发流程,让开发者能够更专注于创意和核心逻辑的实现。
多智能体(Agent)系统与 Auto Mode
Claude Engineer 2.0 充分利用了 Claude 3.5 Sonnet 强大的代码能力,结合多智能体系统,实现了令人印象深刻的 Auto Mode 功能。在这种模式下,开发者只需发布命令,AI 就能自动解决问题、修改目录结构、输出代码。这种自动化程度的提高,大大减少了开发者的重复性工作。
同时,Claude Engineer 2.0 也保留了人类干预的可能性。开发者可以通过上传图片或提供文件地址来辅助 AI 更好地理解和执行任务。这种人机协作的模式,既发挥了 AI 的高效性,又保证了人类开发者对整个过程的掌控。
交互式命令行界面
Claude Engineer 2.0 提供了一个功能强大的命令行界面(CLI),使开发者能够与 Claude 进行高效的交互。通过简单的命令,开发者可以完成各种复杂的任务,例如:
为 Web 应用程序创建新的 Python 项目结构
解释特定文件的代码并提出改进建议
调试错误信息
分析图像并描述其内容
执行 Python 代码并分析结果
会话管理与资源监控
为了提高工作的连续性和可追溯性,Claude Engineer 2.0 引入了会话管理功能。开发者可以通过输入"save chat"命令,将整个对话保存为 Markdown 文件。这一功能使得开发者可以轻松地在不同时间恢复之前的工作上下文,大大提高了长期项目的管理效率。
此外,Claude Engineer 2.0 还提供了详细的资源使用监控。它会显示每个模型和代理使用的输入输出 token 数量,以及整个对话的总 token 数和相应成本。在每次交互后,系统还会显示 token 使用情况、耗时和模型剩余窗口大小,方便开发者进行后续操作规划。
安全性和性能优化
在注重功能的同时,Claude Engineer 2.0 也没有忽视安全性。所有代码都在预定义的虚拟环境中运行,确保了执行过程的安全性。系统能够在需要时安全地安装依赖,为开发者提供一个可靠的代码执行环境。
在性能方面,Claude Engineer 2.0 也在今天光速支持了我们在文章开头提到的 Anthropic 官方更新:超过 8000 token 的输出。这大大增加了单次交互的信息量。同时,它还支持模型调用代码执行工具来执行代码或长任务,从而能够更高效地分析代码并给出简洁的建议。
值得一提的是,Claude Engineer 2.0 的开发过程中涉及了大量的"提示系统工程"(Prompt System Engineering)理念。开发者们可以通过研究其源代码,深入了解这一强大工具的工作原理,从而在自己的项目中应用这些先进的概念。
正如制作人所说:这个项目投入了大量精力。这是我给社区的礼物,让人们能够创造一个每个人都能创造任何梦想的未来。
既可以玩,又能拿来生产,Anthropic 这次打出的“大杀招” Artifacts 是真正击中了 OpenAI 的要害了。随着 Claude 和 Claude Engineer 这类项目的不断完善和普及,我们有理由相信,软件开发的未来将变得更加智能、高效,让更多的创意得以实现。
推荐阅读:▶绕晕了!9.11 大还是 9.9 大,难倒一批 AI 大模型?
▶自动回复朋友圈,苹果回应iPhone鬼手现象;雷军本周五年度演讲,分享小米造车这三年;OpenAI创始大神卡帕西创业| 极客头条
▶“一年努力白费,7 万多美元打水漂……这简直是开发地狱!”
🔥 夏日炎炎,「AI科技大本营」准备了时尚T 恤、精选图书、精品PPT 等一大波好礼等你来领
扫码回复“抽奖”立即领取!