精选新闻
构建GitHub Copilot编码代理的“信任层”:非确定性场景下的行为验证 github.blog
来源:GitHub Blog 现代软件测试基于“正确行为可重复”的假设,但对于GitHub Copilot编码代理(Agent Mode)等自主代理,尤其是在集成“计算机使用”功能时,这一假设不再成立。代理在与UI、浏览器和IDE等真实环境交互时,正确性呈现多路径特征,如加载屏幕的出现与否、时间变化及多种有效操作序列均可导致相同结果。传统验证方法常因执行路径与脚本不符而产生“假阴性”,阻碍生产流程。本文探讨如何构建独立的“信任层”,通过支配者分析(dominator analysis)关注关键结果而非刚性路径,实现可解释、轻量级且适用于实际CI流水线的代理行为验证。传统测试工具(如基于断言、录制回放、视觉回归测试及ML预言机)因假设执行路径固定而难以应对代理的非确定性行为。为此,需将正确性重新定义为“可靠达成关键结果”,区分“必要状态”(如到达“搜索结果”界面)、“可选变化”(如加载动画)和“收敛路径”(如快捷键与菜单操作的不同序列)。通过将执行轨迹建模为前缀树接受器(PTA)图结构,结合三级等价检测框架(视觉指标、LLM语义分析、保守合并)和支配者分析,可自动识别关键状态并构建“基准真相”模型。新执行轨迹通过拓扑子序列匹配与支配者树比较,仅需关键状态按正确顺序出现即可通过验证,还能提供覆盖率指标和明确失败原因。实验表明,该方法在VS Code扩展测试中准确率、精确率、召回率和F1分数均达100%,显著优于代理自评估(分别为82.2%、83.3%、60.0%、69.8%),并能有效识别“非bug”场景。目前框架需2-10个成功轨迹构建模型,依赖LLM进行语义等价检查,且存在时间约束盲点,未来将致力于加入时间和负面约束、层级多模态抽象及在线学习功能,以推动代理从实验演示走向生产级基础设施。
发布时间:2026-05-07 05:16AI公司Cerence指控亚马逊智能设备侵犯其语音技术专利 law360.com
来源:Law360 人工智能公司Cerence AI于周三指控亚马逊向美国进口的智能设备侵犯了其语音技术专利,已请求美国国际贸易委员会(ITC)调查并考虑禁止这些设备进口,同时在联邦法院提起了类似诉讼。原文未披露具体涉及的亚马逊智能设备型号、Cerence AI所主张的专利编号及具体技术内容,也未提及诉讼的具体请求和索赔金额等细节。
发布时间:2026-05-07 03:23美国先生赛事主办方诉前健美运动员盗用品牌 law360.com
来源:Law360 “美国先生”健美比赛的主办方已对一名前健美运动员提起诉讼,称其在今年突然对自己的整个公司进行品牌重塑,开始使用“Mr. America”商标。案件相关的具体信息,如案件标题、案号、受理法院、诉讼性质、承办法官及立案日期等,均为订阅用户专属内容,原文未披露。涉及的律师事务所为Shulman Rogers,公司包括Instagram Inc.,政府机构涉及美国马里兰州地区法院和美国专利商标局。
发布时间:2026-05-07 03:13Robinhood风险基金IPO吸引超15万散户投资者,CEO称其民主化 techcrunch.com
来源:TechCrunch Robinhood首席执行官Vlad Tenev在《华尔街日报》“未来一切”会议的采访中表示,该金融科技公司新推出的Ventures Fund I吸引了超过15万名散户投资者参与其IPO。该基金在纽约证券交易所上市,允许散户投资者通过公开交易的基金投资于Stripe、Oura、Databricks、OpenAI等私人科技公司。Tenev称这一参与度体现了基金的“民主化”。该基金于2026年3月推出,其投资标的包括OpenAI、Mercor、Ramp、Airwallex、Boom等尚未公开上市的科技公司。Tenev将这些高估值的私人公司称为“前沿公司”,指出当前部分人工智能模型提供商如OpenAI和Anthropic的融资估值已达8500亿至9000亿美元以上,“独角兽”一词已不再适用,未来可能会有多家私人公司在IPO前估值达到数万亿美元。Tenev认为,该新基金符合Robinhood为散户投资者民主化市场准入的更广泛使命。公司最初通过零佣金交易显著增加了散户在公开市场的参与度,现在将投资大型私人公司视为下一步。他将该基金描述为“具有日常流动性的公开交易风险投资公司”,没有资质要求,也不收取附带权益(carry),仅收取有竞争力的管理费,而传统风险投资中有限合伙人通常需支付约20%的利润作为附带权益。Tenev表示,鉴于这些公司的规模以及许多公司选择推迟上市的现状,散户投资者应该能够比IPO更早进入。其愿景是,当公司进行种子轮和A轮融资(即首轮资本)时,散户应占该轮融资的很大一部分,就像现在在公开市场一样,让散户能在底层参与并从私人市场日益增长的潜在增值中受益。
发布时间:2026-05-07 03:10得州东区法院被请求驳回三星7850万美元判决后的重审申请 law360.com
来源:Law360 在一起于得克萨斯州东区法院对三星公司提起的专利侵权诉讼中,专利所有权人获得了7850万美元的侵权判决。目前,该专利所有权人正敦促法院驳回三星公司要求重审的申请,称这家韩国电子巨头试图“颠覆法律”。原文未披露案件的具体专利信息、侵权认定细节以及三星公司申请重审的具体理由。
发布时间:2026-05-07 02:37CAFC维持PTAB裁决:DraftKings未能证明游戏专利权利要求无专利性 ipwatchdog.com
来源:IPWatchdog 美国联邦巡回上诉法院(CAFC)就DK Crown Holdings Inc.(前身为DraftKings, Inc.,简称DK)诉AG 18, LLC案作出裁决,维持美国专利审判和上诉委员会(PTAB)的最终书面决定,认定DK在多方复审(IPR)中未能证明美国第9,978,205号专利的权利要求18无专利性。AG 18, LLC拥有的'205专利题为“基于位置的网络游戏限制”,涉及基于地理位置限制玩家在线 wagering活动的点对点游戏系统。DK曾向PTAB提交IPR申请,挑战该专利的权利要求1至30,PTAB最终认定权利要求1至17以及19至30因被现有技术 anticipation或 obvious而无专利性,仅权利要求18成为上诉焦点并维持有效。权利要求18依赖于独立权利要求12及从属权利要求15、16、17,涉及一种游戏系统,其中 wagering限额转换为非货币 wagering,玩家 winnings同样为非货币形式。DK在其IPR申请中仅依据Bryson的第8,460,109号专利,以理由1和理由2对权利要求18提出挑战,理由3则专门针对权利要求15至17。PTAB启动IPR后,DK在其答复的脚注中请求委员会依据理由3(Bryson与Schlottmann的组合)而非理由1和2分析权利要求18,PTAB拒绝了该请求,认为DK试图引入Schlottmann作为针对权利要求18的新现有技术以填补原始申请中的漏洞,且DK未证明其已履行举证责任。DK寻求主任审查被拒后上诉至CAFC。上诉中,DK主张PTAB拒绝依据理由3分析权利要求18构成“滥用自由裁量权”,称该遗漏为“文书错误”并认为其意图对权利要求18主张理由3是“明显的”,但Chen法官驳回了该论点。CAFC认同PTAB的观点,认为DK在答复脚注中通过添加Schlottmann对权利要求18提出了新的无专利性理由,并强调其判例法禁止委员会考虑申请中未提及的理论,且该迟提的脚注未回应AG 18的专利所有人答复中的任何论点。DK未请求修改申请以纠正所主张的疏忽,并援引Voice Tech Corporation v. Unified Patents, LLC案(涉及申请中的排版错误但实质论点可通过交叉引用识别),但CAFC认为该案不适用,因其申请中无任何交叉引用或迹象表明理由3或Schlottmann适用于权利要求18。此外,DK主张因PTAB已宣告包含权利要求18所有限制的权利要求10、12、15、16、17无效,应依据间接禁反言认定权利要求18无专利性,CAFC彻底驳回该理论,认为DK的分析未满足Ohio Willow Wood Co. v. Alps South案中基于权利要求18与已无效权利要求的相似性证明间接禁反言适用的举证责任,且指出其“从未以DK所建议的方式”适用间接禁反言,即“拼凑”不同权利要求的限制来复制另一权利要求,因此最终维持PTAB的决定,确认'205专利权利要求18有效。
发布时间:2026-05-07 02:15新泽西联邦法官拒绝就明尼苏达州癌症药物欺诈问题认证 law360.com
来源:Law360 新泽西联邦法官不会请求明尼苏达州最高法院就某保险公司能否利用一项通常由总检察长保留的州法律提起诉讼作出裁决。该诉讼指控制药商Celgene通过慈善捐款操纵癌症药物价格。原文未披露该州法律的具体名称、诉讼的详细进展以及法官拒绝认证的具体理由。
发布时间:2026-05-07 02:12AI评估初创公司Braintrust确认数据泄露,要求所有客户轮换敏感密钥 techcrunch.com
来源:TechCrunch AI评估初创公司Braintrust已敦促客户撤销并更换其API密钥,此前发生了一起客户机密泄露事件。根据周一发送给客户并被TechCrunch看到的电子邮件,该初创公司确认其一个亚马逊网络服务(AWS)云账户存在“未授权访问”,该账户包含客户用于访问基于云的AI模型的API密钥。邮件中提到:“我们已与一位受影响的客户进行了沟通,迄今为止未发现更广泛暴露的证据。”同时,邮件要求“每位客户轮换”他们在Braintrust存储的任何API密钥。Braintrust于周二在其网站上披露了这一安全事件,称“事件已得到控制,同时我们已锁定受损账户,审计并限制了相关系统的访问,并轮换了内部机密。”公司表示,此次 breach 的原因正在调查中。Braintrust发言人Martin Bergman告诉TechCrunch,公司向客户发送电子邮件是“出于高度谨慎”,并“确认发生了安全事件,但目前没有证据表明存在数据泄露”。Braintrust提供一个旨在让公司监控AI模型和产品的平台,其创始人兼首席执行官Ankur Goyal此前曾告诉TechCrunch,Braintrust就像是“为构建AI软件的工程师打造的操作系统”。该初创公司在2月份的B轮融资中筹集了8000万美元,公司估值达8亿美元。网络安全初创公司Nudge Security的联合创始人Jaime Blasco收到了Braintrust的 breach 电子邮件警报,他告诉TechCrunch,该事件可能对受影响的客户产生“下游影响”,例如依赖Braintrust的AI公司。黑客经常将目标对准云服务或第三方平台上的企业账户,以此作为窃取API密钥等机密的有效方式。一旦黑客获得API密钥,他们就可以登录公司或客户的系统,看似合法用户,而无需侵入目标公司的系统。2023年,为软件工程师提供开发产品的公司CircleCI曾遭遇类似的云数据 breach,并同样要求其客户轮换存储在该公司的“任何和所有机密”。最近,欧盟一家网络安全机构称,黑客能够从欧盟委员会使用的一个受损AWS账户中窃取92GB数据,该 breach 影响了其他29个欧盟实体以及数十名欧盟委员会内部客户的数据。
发布时间:2026-05-07 02:05美国专利审判和上诉委员会快速上诉程序延长两年 law360.com
来源:Law360 美国专利审判和上诉委员会(PTAB)于周三宣布,其旨在更快解决被驳回专利申请上诉的快速上诉程序将延长至2028年。原文未披露该程序的具体运作机制、延长的具体原因、此前的实施效果数据以及是否有相关修订内容。
发布时间:2026-05-07 01:44得州公司被诉拖欠海军项目分包商款项并侵吞知识产权 law360.com
来源:Law360 一家怀俄明州公司向得克萨斯州联邦法院提起诉讼,指控资产管理公司Shipcom Federal Solutions LLC拖欠其近460万美元款项,该款项涉及为美国海军合同提供的产品和服务,同时还指控该得州公司侵吞其知识产权。原文未披露案件的具体细节,如合同签订时间、知识产权的具体类型以及侵吞行为的具体方式等。
发布时间:2026-05-07 01:27