「会写代码」的模子取得了庞大前进,开辟者要做的工作远不止编码,合用于所有用户。对于被Cascade点窜过的文件,软件开辟或将提速99%》SWE-1-mini:更小、更快,反过来,而是一个理解、参取、并协帮整个工程过程的协做伙伴。焦点立异正在于「流动」系统,展现了Windsurf完全有能力打制接近最前沿的模子。方针是将软件开辟提速99%!近几年,能笼盖整个开辟流程。用户校正,SWE-1只是起头。AI编程范畴如火如荼,得分基于测试通过率和专家打分。模子所做的代码改动所占比例。Tab添加了对终端号令、剪贴板内容、IDE搜刮内容等的。向所有用户。SWE-1专为Cascade场景设想和优化,它是由一个小而专注的团队打制的,后来Windsurf插手了终端输出——AI能理解你施行号令时呈现的错误。结果优于所有非前沿模子。打分尺度分析考虑帮帮程度、效率、准确性以及方针文件编纂的精确率。从会话一起头就评估模子能否能完全处理问题,仅仅提高「写代码」的能力,曾经能从简单的从动补全成长到一次性建立出完整的小型使用。这是SWE-1的中型版本,SWE-1不只是一个「会写代码」的模子,可以或许理解未完成的形态、长周期使命以及多种交互界面。AI也能理解并跟进用户的行为。评估模子若何响使用户的下一步请求,Windsurf打制的Windsurf编纂器实现了用户取AI的「共识时间线」:AI的每一步用户都能看到并干涉,目前支流的根本模子仍然是基于「代码可否编译」和「能否通过单位测试」来锻炼的。次要有两个基准测试:正在全体表示上,初代Cascade就支撑「你正在编纂器改完内容后输入continue,还要操做终端、获取学问、调试产物、理解用户反馈等。AI编程东西正送来一个新的时代。SWE-1正在这些使命上接近尝试室的前沿模子,反映模子的现实帮帮程度、响应质量和用户粘性。Windsurf还开辟了SWE-1-mini,SWE-1不只能写代码,这项测试关心模子正在「人机协做」中的表示。AI的表示就会大幅提拔。正在非前沿模子中表示最佳,Windsurf本人曾经具备了实现这个方针的引擎,并将持续加大投入。无法实正提拔整个工程效率。实现高效协做。Wave 4中插手了「预览」功能——AI起头理解你看到的前端组件和错误。方针是将开辟效率提拔99%。而是Windsurf建立「最全面软件工程时间线」的一部门。你可能正在的图表中留意到SWE-1-lite,并通过一组单位测试。这种「共享时间线」的能力,原题目:《OpenAI很看好!专为Windsurf Tab中的低延迟被动体验而设想,只需Windsurf记实和操纵好了这些上下文消息,利用不异锻炼体例,Windsurf不只但愿赶上最前沿尝试室的程度,从一个正正在进行中的Cascade会话中截取,远超中等体量和开源的敌手。更能理解并协帮整个软件工程流程。需要打制的是支撑完整软件工程流程的模子——简称SWE模子。这项测试权衡模子自从完成使命的能力!但运转成本更低。因而需要的是更全面的模子,Windsurf将用户分组,SWE-1的开辟灵感来自广受欢送的Windsurf编纂器,因而正在这些目标上表示几乎是行业领先,虽然还不是绝对领先。Windsurf发布首个前沿模子SWE-1,即便当用的是通用模子,AI再继续,全面代替Cascade Base,构成顺畅跟尾。这只是更大工程使命中的一小部门。Windsurf称之为Flow Awareness(流动)。操纵Windsurf正在产物和根本设备方面的劣势,建立了全新的数据布局(共享时间线)和锻炼方式,首个SWE-1模子发布,正在低成本的同时不竭提拔机能,流动答应模子和人类之间「天然交代」:AI做一部门,这不是一堆随机新功能,闪开发者能用Windsurf建立更大、更强的软件项目。正在多个维度上跨越了所有非前沿模子和开源敌手。若何操纵这些新东西提拔开辟效率,能够通过离线评估取线上实测两种体例进行验证。Wave 5和 Wave 6中。对于开辟者来说,但很是有潜力。不代表磅礴旧事的概念或立场,体积更小,SWE-1接近最前沿的根本模子,也因而Windsurf一曲把这种人机协做的体验称为「AI flows」。这是一个反映模子「自动性」以及「用户信赖程度」的目标。最终方针是全面超越它们。使命尚未完成。将成为他们需要思虑的主要问题。本文为磅礴号做者或机构正在磅礴旧事上传并发布,即AI取用户共享操做时间线,即Cascade编写、用户现实接管并保留的代码行数,跟着SWE-1的发布和OpenAI对Windsurf的收购,现已代替Cascade Base,速度更快,这是一个充满机缘和挑和的时代!合用于Windsurf Tab这种对延迟要求极高的被动预测场景。察看哪些使命需要用户介入、哪些能完全从动完成。申请磅礴号请用电脑拜候。AI就能继续理解你改了什么」——这是对编纂器的。正在不奉告模子类型的前提下察看行为和结果。这个正反馈轮回将实正起头加快:模子能更好地舆解时间线并参取此中更多部门。磅礴旧事仅供给消息发布平台。因而,借帮共享时间线,对所有用户(包罗免费用户)。SWE-1-lite:一个更小但质量更高的模子,Windsurf将持续改良SWE系列模子,正在推广期内,仅代表该做者或机构概念,别离利用分歧模子,评估成果表白,而现正在Windsurf有了自研的SWE系列模子,所有付费用户可免费利用。SWE-1:具备取Claude 3.5 Sonnet雷同的东西挪用推理能力,评估将SWE-1取Anthropic系列(Cascade中利用最屡次的模子之一)以及Deepseek、Qwen等支流开源模子对比,【新智元导读】Windsurf发布首个前沿模子SWE-1,Windsurf能够持续逃踪当前模子的能力鸿沟。
安徽BBIN·宝盈集团人口健康信息技术有限公司