
日前,智慧芽基于PatentBench评测基准,扩容评测数据集,对近期更新迭代的智慧芽“查新检索Agent”再度开展基准测试。测试结果显示:智慧芽“查新检索Agent” 在Top100返回结果中的“X检出率”和“X查全率”分别达到81%和36%,实现性能的显著跃升。
更严格的评测标尺
普适性与可靠性升级
相较于今年8月份评测中89个样本的评测规模,此次评测数据集扩容至340个样本,覆盖面更广、测试维度更全面。评测数据在IPC分类号上均匀分布,确保了从主流技术到小众领域的全覆盖;语言分布上,32%为中文文本、68%为英文文本,有效突破语言壁垒;在受理局分布上,中国国家知识产权局(CN)和美国专利及商标局(US)各占约32%,欧洲专利局(EP)和世界知识产权组织(WO)各占约18%,充分考虑了不同国家和地区的审查习惯差异。

这一更加严格的评测标尺,不仅提升了PatentBench评测的挑战性,更确保了评测结果在真实专利查新工作场景的普适性和可靠性。
智慧芽查新检索Agent
核心指标实现双重突破
评测结果显示,智慧芽“查新检索Agent”取得了更佳成绩:
X检出率创新高:在Top100返回结果中的X检出率达到81%;Top50的X检出率更是达到了71%,展现了卓越的检索精准度。

X查全率稳步提升:在Top100返回结果中的X查全率从32%提升至36%,检索覆盖能力持续增强。

更大规模的数据集验证了81%X检出率的稳定性和可重复性,充分证明了智慧芽"查新检索Agent"的评测佳绩并非偶然,而是建立在自身的高性能之上。
究其原因,智慧芽“查新检索Agent”在近期更新中,引入多特征融合排序模型,实现更精准的结果排序,有效推动X检出率的明显提升。与此同时,该AI Agent基于智能化检索策略引擎,其检索策略设计更贴合审查员习惯。此外,智慧芽引入强化学习模型,持续驱动检索策略的自我优化和迭代,确保系统性能的不断进化。
立即扫码免费试用【查新检索Agent】

