AI-IDE开启的Vibe Coding时代-上篇
作者:微信文章本期将详细介绍当前的vibe coding工具箱,开源的、闭源的一网打尽。
首先介绍下背景,从250608左右TRAE开始收费之后,基本上处于一个不可用状态,无论什么模型都要排队,Sonnet4基本默认等待队里都是50+,gpt4.1都要排队至少20+,没办法,只能结合私有模型调研开源方案,正好最近有一个AI提效的小项目,就顺利的完成了continue的落地实践。
整体使用下来感觉还可以,除了一些小bug,整体能解决80%的问题,于是就有了这篇文章。
1、当前流行的插件
1.1 闭源商用
1)Cursor
4名MIT本科生创业,才两年公司就已经估值4亿美元,要知道这当时是一家只有12人的公司。最早起源于开发AI编码助手Cursor的Anysphere,在A轮融资中已经筹集超6000万美元。AI编码Copilot的赛道已经被充分证明其价值,且变得越来越拥挤。除了Anysphere之外,类似的初创公司还有Cognition、Poolside、Magic和Augment。
Cursor基于VS Code生态深度改造,融合了GPT - 4和Claude 3.5模型。支持自然语言转代码生成、跨文件智能补全和自动文档生成。拥有上下文感知能力,可同时分析10 + 个关联文件的语义逻辑;具备Agent模式,能通过任务分解实现全流程自动化开发;支持多模态交互,允许图像、链接等非结构化数据输入。
最新的CursorV1.0首个大版本能自动捉bug,秒改屎山代码,让AI寻找和修改bug成为可能,AI替代人类程序员进入下一个阶段。
主要功能包括:
- 更丰富的聊天回复:对话中直接渲染可视化内容,比如Mermaid图表和Markdown表格;
- 点击「在Cursor中修复」(Fix in Cursor)按钮后,可以直接跳转到Cursor编辑器,就会看到填充好的修复建议,进而快速解决问题。
2)TRAE
字节版Cursor,在爆火的 AI 编程领域,字节并不满足于 MarsCode 一个产品形态,又憋了个大招——Trae,再一次看到了“字节的野心不断跳动,AI 的战火持续燃烧”。自此,字节 AI 的疆土又扩大了一圈。
在 250303,Trae 上线了国内版,这也是国内首个 AI IDE。Trae 国内版与 MarsCode 是由同一团队开发,针对不同场景设计。作为一款智能协作 AI IDE,Trae 以动态协作为核心,提供人机协同、相互增强的开发体验,让用户灵活适配场景。相较插件类产品,它拥有原生 AI 体验,更好地感知项目上下文,支持定制与扩展,带来端到端的流畅开发。
2)Windsurf
Windsurf由Codeium推出,凭借深度上下文引擎和终端集成脱颖而出。具有强大的上下文理解能力和多步骤、多工具协同工作的能力,能智能感知项目结构和代码逻辑,主动预测开发者需求并提供精准代码建议。其Cascade功能提供编辑和聊天两种模式,允许创建和修改代码库。
Windsurf最近发布首个前沿模型SWE-1,目标是将开发效率提升99%。SWE-1不仅能写代码,更能理解并协助整个软件工程流程。核心创新在于「流动感知」系统,即AI与用户共享操作时间线,实现高效协作。
Anthropic最近因为被OpenAI收购的问题,突然切断Windsurf对Claude 3.x系列模型的API访问权限!Windsurf CEO公开控诉,称仅获五天通知。
3)Bolt
Bolt的最大特点是他的定位,不是辅助也不是改bug,而是一句话帮你写一个完整的网站插件或者一款APP。
相比较其他的 AI 代码工具,Bolt.new 基于浏览器的一站式解决方案,面对的人群也更大众——非专业开发者群体。Bolt 重新定义了软件开发的工具,而 Cursor 是对现有工具的有效改进,Bolt 更有可能颠覆 Wix; Figma 取代了需要下载的 Photoshop,Google Docs 取代了桌面版 Word,Bolt 从本地配置环节开始就降低了用户开发门槛。
Bolt 之前就一直专注于web 应用构建,2021年推出了浏览器编程的技术 WebContainers。结合了 AI 的代码生成能力,才有了今天的 Bolt。StackBlitz 通过创新性地推出 WebContainers 技术解决了这个问题,它能直接在浏览器中运行微型操作系统。每月有超过 300 万开发者使用 StackBlitz,使得 Web 开发比传统的云基础设施开发环境更加易于上手。
Bolt 在 4 周内就从零突破至 400 万美元年度经常性收入(ARR),2 个月内突破 2000 万 ARR,每天 50 万美元的 ARR 增长,并且每天的用户增长翻倍。
4)Firebase
Google Firebase 是 Google 提供的一套移动和 Web 应用开发平台,旨在帮助开发者更快地构建高质量的应用。它提供了一系列工具和服务,涵盖了从后端数据存储到用户认证、性能监控等多个方面,让开发者可以专注于应用的前端开发,而无需花费大量精力搭建和维护复杂的后端基础设施。
Firebase提供了多种后端服务,如实时数据库、存储、身份验证、云函数、托管等。可以帮助开发者快速搭建应用的后端基础设施,无需自己搭建服务器。
1.2 开源插件
1)Cline-46k
Cline 是一款专为 VSCode 打造的开源 AI 编程插件,也是目前关注量最高的开源AI插件,致力于将自然语言描述转化为高质量代码,功能最为强大的VScode插件。
它不仅具备代码自动补全、生成注释、代码调试、文件创建与编辑等功能,还能执行终端命令,实现从项目创建到文件维护的完整开发流程。主要功能有:
- 内置代码解释器,可自动对复杂代码段进行注释和解释,方便理解遗留或第三方代码。
- 自动化单元测试生成,覆盖率高,有助于保证代码质量。
2)Continue-27.2k
Continue最大的特点是同时支持VScode和IDEA等Jetbrain系列的插件,是一款主打“自然语言驱动”的 AI 编程插件,专注于用对话式交互提升开发协作效率。大量社区维护的扩展和内置 prompt 库,方便做多样化开发提效。
开源且同时支持这VScode和Jetbrain生态的插件并不多,Cursor虽好,但是仅对VScode的用户友好,要知道全球更多开发者使用的IDE是JetBrain家的。据我了解,公司后端大部分都是用的IDEA,前端和算法更偏爱VScode。因此后端同学很多使用Cursor来看别人代码,仅仅是看。
3)Void-24.2k
Void 是近年来新兴的 AI 编程助手,主打高效、极简和隐私友好。Void提供类似“无感”代码补全、自动生成关键函数、快速解释复杂代码块、注释生成等功能。
2、以continue为例介绍核心原子操作
2.1 配置文件和原子action
主要的配置文件在~/.continue/config.yaml目录下,除了yaml之外还支持json等多种配置格式。
1) chat
侧边栏chat,点击或者输入@后会让你选择不同的文件进行提问,code和file的区别的code是已经把代码按照类或者函数拆分,更细粒度!
也可以选中代码cmd+L,将代码块自动移动到侧边栏进行提问
2)edit
本质上是内联代码chat,就是他可以对现有文件内容进行直接更改,你可以通过选择应用的方式确定是否执行。直接用cmd+I可以直接在代码块附近提问,提问后可以直接输出结果,也可以直接应用代码。
当然这种内联提问还可以扩展到IDE的其他地方,比如终端(Terminal)上。
3)apply
本质是对比原本代码和llm写出的代码的差异,类似git的diff命令,判定差异,然后帮你把更新的内容写入文件中,然后你自己决定是否accept。这一点可以从配置文件里,apply的提示词模版就可以清楚的看出。
点击apply之后,可以看到类似git的的代码操作,红色表示删除,绿色表示新增或者修改。可以选择代码片段级别的accept或者reject,也可以对整个代码文件进行选择。
4)autocomplete
本质就是一个小模型,比如qwen2.5-0.5B,在你写代码的时候的提词器,猜测你下一个词或者下一段函数的实现。常用的是函数体定义,敲完函数名称自动帮你把代码实现补全,大大提高效率。这个在java这种形式化比较突出的编辑器里面很早就利用了,在大模型时代逐步做得更完善。
如下图,浅色的部分即为AI-IDE帮我们自动补全的代码片段,这个补全功能整体使用下来github的copilot的效果最好,但是使用过程中也会发现一些隐私问题,比如有些时候会自动补全代码片段中包含人名或者奇怪的号码。
AI安全攻防问题值得研究!
5)embedding&rerank
continue默认会对当前工程的所有文件调用embedding模型建索引,基本上就是你打开一个项目第一步就开始建索引,导入向量数据,第二步在提问后进行检索,第三步基于检索的topk命中条目进行重排,可以选择rerank模型,也可以按照余弦相似度排序。
6)Agent/Builder模式
类似于Anthropic的claudecode和OpenAI的codex或者类似CodeInterper,可以构建一个智能体,结合大模型的输出自动帮你规划任务,比如创建文件、写代码、执行、报错查询、重写代码,就是说可以帮你多步尝试、调试,直到最终写出一个你能直接用的代码或者产品。
对应的需要再模型配置中加入工具调用的参数,这样在对话框下面就会显示一个agent的选项。
Builder模式最早是在Cursor和trae里面看到,可以自动帮你创建完一整个工程,有点类似claude-code的功能,OpenAI和codex和googledeepmind的gemini-cli紧随其后。
2.2 主要不足
1)生成的过程的取消按钮在对话框右上方,不明显,这个在Cursor和trae均有明显的状态变更;
2)打开对话框不能默认跟当前代码文件对话!!每次都需要手动@后对话;而且后加上空格之后@或者直接点击@按钮才行;这个我感觉是使用下来最不舒服的一点。
3)Jetbrain家的产品例如pyCharm点击apply的时候存在一些小bug;
2.3、常用快捷键
cmd+I:代码块内联编辑;
cmd+L:圈选代码块到侧边栏聊天框;
cmd+J:在idea打开continue的侧边栏;
3、Agent模式
代理模式的关键在于其“工具”机制。模型在接收用户请求时,会同时获取可用的工具列表。模型可以根据需要选择调用这些工具,例如读取文件、创建新文件、执行终端命令、进行网页搜索等。用户通常需要授权工具的调用,但某些工具也可以设置为自动执行。这种机制使得代理模式能够与外部世界交互,执行多步骤、跨文件的复杂任务。
当前我本地调用continue存在一些问题,以Cursor为例展示,展示下高德和context7两个mcp的执行效果。
1)高德mcp
2)context7
4、本地向量数据库存储
continue有一个统一配置原子功能对应的模型和模版的地方,在continue的主目录,一般在~/.continue目录下面。
对于mcpserver我看到好像是每个工程目录下会新建一个子目录.continue,如果有最新的配置可以加入对应的文件下面。
每次打开新的项目后,continue在提问时会自动进行文件的切片和向量入库,将embedding之后的内容写入本地的sqlite数据库,路径在index文件夹下面。
具体的向量数据库文件列表:
关于AI-IDE的上篇先介绍到这里,主要介绍了开源闭源工具以及开源插件的使用核心原子功能。在下篇中将详细介绍下ide的详细运作机制以及背后跟mcp工具交互的原理。
6、参考
1)Cursor融资
https://mp.weixin.qq.com/s/mUjL0JbBBnoORrXZlNh3OQ
Cursor1.0
https://mp.weixin.qq.com/s/4zurzWK9f5xx48GJSDvjDA
2)Windsurf
SWE专项训练
https://mp.weixin.qq.com/s/HGkLkzbRJ1aDco_GWtpTIg
OpenAI收购导致Claude断供
https://mp.weixin.qq.com/s/jI_bIs9REx8StLs906-6ew
3)TRAE
字节版本Cursor亮相
https://mp.weixin.qq.com/s/ljUgh6TmwMDZtqnUgyI0ig
封闭开发数月
https://mp.weixin.qq.com/s/4y-gswCBSFiko_0jYwd2nw
Trae 上线了国内版
https://mp.weixin.qq.com/s/9H-gkssBrdVw37bzd3e1IQ
页:
[1]