精选新闻
构建GitHub Copilot编码代理的“信任层”:非确定性场景下的行为验证 github.blog
来源:GitHub Blog 现代软件测试基于“正确行为可重复”的假设,但对于GitHub Copilot编码代理(Agent Mode)等自主代理,尤其是在集成“计算机使用”功能时,这一假设不再成立。代理在与UI、浏览器和IDE等真实环境交互时,正确性呈现多路径特征,如加载屏幕的出现与否、时间变化及多种有效操作序列均可导致相同结果。传统验证方法常因执行路径与脚本不符而产生“假阴性”,阻碍生产流程。本文探讨如何构建独立的“信任层”,通过支配者分析(dominator analysis)关注关键结果而非刚性路径,实现可解释、轻量级且适用于实际CI流水线的代理行为验证。传统测试工具(如基于断言、录制回放、视觉回归测试及ML预言机)因假设执行路径固定而难以应对代理的非确定性行为。为此,需将正确性重新定义为“可靠达成关键结果”,区分“必要状态”(如到达“搜索结果”界面)、“可选变化”(如加载动画)和“收敛路径”(如快捷键与菜单操作的不同序列)。通过将执行轨迹建模为前缀树接受器(PTA)图结构,结合三级等价检测框架(视觉指标、LLM语义分析、保守合并)和支配者分析,可自动识别关键状态并构建“基准真相”模型。新执行轨迹通过拓扑子序列匹配与支配者树比较,仅需关键状态按正确顺序出现即可通过验证,还能提供覆盖率指标和明确失败原因。实验表明,该方法在VS Code扩展测试中准确率、精确率、召回率和F1分数均达100%,显著优于代理自评估(分别为82.2%、83.3%、60.0%、69.8%),并能有效识别“非bug”场景。目前框架需2-10个成功轨迹构建模型,依赖LLM进行语义等价检查,且存在时间约束盲点,未来将致力于加入时间和负面约束、层级多模态抽象及在线学习功能,以推动代理从实验演示走向生产级基础设施。
发布时间:2026-05-07 05:16Robinhood风险基金IPO吸引超15万散户投资者,CEO称其民主化 techcrunch.com
来源:TechCrunch Robinhood首席执行官Vlad Tenev在《华尔街日报》“未来一切”会议的采访中表示,该金融科技公司新推出的Ventures Fund I吸引了超过15万名散户投资者参与其IPO。该基金在纽约证券交易所上市,允许散户投资者通过公开交易的基金投资于Stripe、Oura、Databricks、OpenAI等私人科技公司。Tenev称这一参与度体现了基金的“民主化”。该基金于2026年3月推出,其投资标的包括OpenAI、Mercor、Ramp、Airwallex、Boom等尚未公开上市的科技公司。Tenev将这些高估值的私人公司称为“前沿公司”,指出当前部分人工智能模型提供商如OpenAI和Anthropic的融资估值已达8500亿至9000亿美元以上,“独角兽”一词已不再适用,未来可能会有多家私人公司在IPO前估值达到数万亿美元。Tenev认为,该新基金符合Robinhood为散户投资者民主化市场准入的更广泛使命。公司最初通过零佣金交易显著增加了散户在公开市场的参与度,现在将投资大型私人公司视为下一步。他将该基金描述为“具有日常流动性的公开交易风险投资公司”,没有资质要求,也不收取附带权益(carry),仅收取有竞争力的管理费,而传统风险投资中有限合伙人通常需支付约20%的利润作为附带权益。Tenev表示,鉴于这些公司的规模以及许多公司选择推迟上市的现状,散户投资者应该能够比IPO更早进入。其愿景是,当公司进行种子轮和A轮融资(即首轮资本)时,散户应占该轮融资的很大一部分,就像现在在公开市场一样,让散户能在底层参与并从私人市场日益增长的潜在增值中受益。
发布时间:2026-05-07 03:10CAFC维持PTAB裁决:DraftKings未能证明游戏专利权利要求无专利性 ipwatchdog.com
来源:IPWatchdog 美国联邦巡回上诉法院(CAFC)就DK Crown Holdings Inc.(前身为DraftKings, Inc.,简称DK)诉AG 18, LLC案作出裁决,维持美国专利审判和上诉委员会(PTAB)的最终书面决定,认定DK在多方复审(IPR)中未能证明美国第9,978,205号专利的权利要求18无专利性。AG 18, LLC拥有的'205专利题为“基于位置的网络游戏限制”,涉及基于地理位置限制玩家在线 wagering活动的点对点游戏系统。DK曾向PTAB提交IPR申请,挑战该专利的权利要求1至30,PTAB最终认定权利要求1至17以及19至30因被现有技术 anticipation或 obvious而无专利性,仅权利要求18成为上诉焦点并维持有效。权利要求18依赖于独立权利要求12及从属权利要求15、16、17,涉及一种游戏系统,其中 wagering限额转换为非货币 wagering,玩家 winnings同样为非货币形式。DK在其IPR申请中仅依据Bryson的第8,460,109号专利,以理由1和理由2对权利要求18提出挑战,理由3则专门针对权利要求15至17。PTAB启动IPR后,DK在其答复的脚注中请求委员会依据理由3(Bryson与Schlottmann的组合)而非理由1和2分析权利要求18,PTAB拒绝了该请求,认为DK试图引入Schlottmann作为针对权利要求18的新现有技术以填补原始申请中的漏洞,且DK未证明其已履行举证责任。DK寻求主任审查被拒后上诉至CAFC。上诉中,DK主张PTAB拒绝依据理由3分析权利要求18构成“滥用自由裁量权”,称该遗漏为“文书错误”并认为其意图对权利要求18主张理由3是“明显的”,但Chen法官驳回了该论点。CAFC认同PTAB的观点,认为DK在答复脚注中通过添加Schlottmann对权利要求18提出了新的无专利性理由,并强调其判例法禁止委员会考虑申请中未提及的理论,且该迟提的脚注未回应AG 18的专利所有人答复中的任何论点。DK未请求修改申请以纠正所主张的疏忽,并援引Voice Tech Corporation v. Unified Patents, LLC案(涉及申请中的排版错误但实质论点可通过交叉引用识别),但CAFC认为该案不适用,因其申请中无任何交叉引用或迹象表明理由3或Schlottmann适用于权利要求18。此外,DK主张因PTAB已宣告包含权利要求18所有限制的权利要求10、12、15、16、17无效,应依据间接禁反言认定权利要求18无专利性,CAFC彻底驳回该理论,认为DK的分析未满足Ohio Willow Wood Co. v. Alps South案中基于权利要求18与已无效权利要求的相似性证明间接禁反言适用的举证责任,且指出其“从未以DK所建议的方式”适用间接禁反言,即“拼凑”不同权利要求的限制来复制另一权利要求,因此最终维持PTAB的决定,确认'205专利权利要求18有效。
发布时间:2026-05-07 02:15AI评估初创公司Braintrust确认数据泄露,要求所有客户轮换敏感密钥 techcrunch.com
来源:TechCrunch AI评估初创公司Braintrust已敦促客户撤销并更换其API密钥,此前发生了一起客户机密泄露事件。根据周一发送给客户并被TechCrunch看到的电子邮件,该初创公司确认其一个亚马逊网络服务(AWS)云账户存在“未授权访问”,该账户包含客户用于访问基于云的AI模型的API密钥。邮件中提到:“我们已与一位受影响的客户进行了沟通,迄今为止未发现更广泛暴露的证据。”同时,邮件要求“每位客户轮换”他们在Braintrust存储的任何API密钥。Braintrust于周二在其网站上披露了这一安全事件,称“事件已得到控制,同时我们已锁定受损账户,审计并限制了相关系统的访问,并轮换了内部机密。”公司表示,此次 breach 的原因正在调查中。Braintrust发言人Martin Bergman告诉TechCrunch,公司向客户发送电子邮件是“出于高度谨慎”,并“确认发生了安全事件,但目前没有证据表明存在数据泄露”。Braintrust提供一个旨在让公司监控AI模型和产品的平台,其创始人兼首席执行官Ankur Goyal此前曾告诉TechCrunch,Braintrust就像是“为构建AI软件的工程师打造的操作系统”。该初创公司在2月份的B轮融资中筹集了8000万美元,公司估值达8亿美元。网络安全初创公司Nudge Security的联合创始人Jaime Blasco收到了Braintrust的 breach 电子邮件警报,他告诉TechCrunch,该事件可能对受影响的客户产生“下游影响”,例如依赖Braintrust的AI公司。黑客经常将目标对准云服务或第三方平台上的企业账户,以此作为窃取API密钥等机密的有效方式。一旦黑客获得API密钥,他们就可以登录公司或客户的系统,看似合法用户,而无需侵入目标公司的系统。2023年,为软件工程师提供开发产品的公司CircleCI曾遭遇类似的云数据 breach,并同样要求其客户轮换存储在该公司的“任何和所有机密”。最近,欧盟一家网络安全机构称,黑客能够从欧盟委员会使用的一个受损AWS账户中窃取92GB数据,该 breach 影响了其他29个欧盟实体以及数十名欧盟委员会内部客户的数据。
发布时间:2026-05-07 02:05美国专利审判和上诉委员会快速上诉程序延长两年 law360.com
来源:Law360 美国专利审判和上诉委员会(PTAB)于周三宣布,其旨在更快解决被驳回专利申请上诉的快速上诉程序将延长至2028年。原文未披露该程序的具体运作机制、延长的具体原因、此前的实施效果数据以及是否有相关修订内容。
发布时间:2026-05-07 01:44得州公司被诉拖欠海军项目分包商款项并侵吞知识产权 law360.com
来源:Law360 一家怀俄明州公司向得克萨斯州联邦法院提起诉讼,指控资产管理公司Shipcom Federal Solutions LLC拖欠其近460万美元款项,该款项涉及为美国海军合同提供的产品和服务,同时还指控该得州公司侵吞其知识产权。原文未披露案件的具体细节,如合同签订时间、知识产权的具体类型以及侵吞行为的具体方式等。
发布时间:2026-05-07 01:27美国最高法院Cox案裁决维持ISP版权责任现状 law360.com
来源:Law360 尽管部分评论人士预测美国最高法院近期在Cox诉Sony案中的裁决将产生重大影响,但CM Law的Courtney Sarnow认为,该裁决实际上正确维持了互联网服务提供商(ISP)版权侵权责任的现状。2026年3月25日,美国最高法院就Cox Communications Inc.诉Sony Music Entertainment案作出一致裁决,支持Cox。自该裁决作出后的数周内,从博客作者到美国版权局局长等各类评论人士均将该判决解读为对版权侵权诉讼范围的显著限制。原文未披露裁决的具体内容及法院的推理过程。
发布时间:2026-05-07 01:24SpaceX考虑在得克萨斯州投资至多1190亿美元建设'Terafab'芯片工厂 techcrunch.com
来源:TechCrunch 据得克萨斯州格里姆斯县网站上的一份提案显示,埃隆·马斯克旗下的太空公司SpaceX(其同时容纳AI公司xAI)正考虑在该县建设一座半导体工厂,初步投资至少为550亿美元。该公司估计,这个名为'Terafab'的项目总投资可能高达1190亿美元,将建成一个“多阶段、下一代、垂直整合的半导体制造及先进计算制造设施”。马斯克此前已概述了该项目计划,特斯拉也将为此贡献资源,同时还联合了芯片制造巨头英特尔,旨在开发用于AI服务器、卫星、SpaceX拟议中的太空数据中心以及特斯拉自动驾驶车辆和机器人的芯片。马斯克表示,该制造设施未来将生产足够提供每年1太瓦电力的芯片,他认为半导体制造商目前的芯片生产速度无法满足其公司在人工智能和机器人领域的需求,称“我们要么建造Terafab,要么就没有芯片,而我们需要芯片,所以我们建造Terafab”。不过,马斯克在周三的推文中提到,得克萨斯州的格里姆斯县只是该工厂的几个考虑地点之一。此次提交文件之际,马斯克正加倍确保xAI拥有足够的计算能力来训练和运行其Grok系列AI模型,同时他还计划通过建设太空数据中心来利用对AI计算的需求,这也是他将xAI与SpaceX合并的重要原因。合并后的实体据称估值达1.25万亿美元,预计将于6月上市。
发布时间:2026-05-07 01:23乔·吉布斯赛车公司拟增加指控称竞争对手窃取商业秘密 law360.com
来源:Law360 乔·吉布斯赛车有限责任公司(Joe Gibbs Racing LLC)已向美国北卡罗来纳州联邦法院提出申请,请求允许其在针对竞争对手纳斯卡(NASCAR)车队的诉讼中增加指控内容,以证明该竞争对手雇佣其前员工的目的就是为了让该员工携带其商业秘密。原文未披露该诉讼的具体案号、受理法院的具体名称、所涉及商业秘密的具体内容、该员工的身份信息以及竞争对手车队的具体名称等详细信息。
发布时间:2026-05-07 00:56英伟达须面对作者提起的大部分AI版权诉讼 law360.com
来源:Law360 美国加利福尼亚州联邦法官在一项拟议的集体诉讼中驳回了替代侵权索赔,该诉讼由作者提起,指控芯片制造巨头英伟达公司(Nvidia Corp.)使用其受版权保护的作品来训练人工智能。不过,法官允许关于英伟达从在线影子图书馆获取书籍以开发各种AI模型的索赔继续进行。
发布时间:2026-05-07 00:23