返回主站|会员中心|保存桌面

爱普生机器人综合服务商    

爱普生机器人|爱普生scara机器人

新闻分类
  • 暂无分类
站内搜索
 
首页 > 新闻中心 > 阿里巴巴于2025年5月30日开源了自主搜索AI智能体WebAget!
新闻中心
阿里巴巴于2025年5月30日开源了自主搜索AI智能体WebAget!
发布时间:2025-06-02        浏览次数:14        返回列表

阿里巴巴于2025年5月30日开源了自主搜索AI智能体WebAgent,该智能体具备端到端的自主信息检索与多步推理能力,能够像人类一样在网络环境中主动感知、决策和行动。以下是对WebAgent的详细介绍:

一、核心功能

  • 自主信息检索:WebAgent能够主动搜索多个学术数据库,筛选出最相关的文献,并根据用户的需求进行深入分析和总结。

  • 多步推理能力:WebAgent不仅能识别文献中的关键信息,还能通过多步推理将不同文献中的观点进行整合,最终为用户提供一份全面且精准的研究报告。

二、技术架构

  • WebDancer:一种端到端智能体训练框架,旨在增强基于网络的AI智能体的多步骤信息搜索能力。WebDancer的框架由数据构建、监督微调(SFT)、强化学习(RL)等阶段组成,逐步打造出能够自主完成复杂信息检索任务的智能体。

  • WebWalker:属于“Web遍历中的LLM基准测试”,用于评估和优化Web智能体的性能。

三、技术特点与创新

  • 数据构建创新:WebDancer通过两种创新的数据合成方法来解决传统数据集的局限性,确保生成的轨迹既有效又连贯。

  • 监督微调(SFT):通过高质量的轨迹数据对智能体进行初始化训练,使其能够适应信息检索任务的格式和环境要求。在SFT过程中,WebDancer将轨迹中的思考、行动和观察内容分别标记,并计算损失函数,以优化模型的参数。

  • 强化学习(RL):采用DAPO算法,这是一种专门针对智能体训练设计的强化学习算法。DAPO算法通过动态采样机制,有效利用未充分利用的QA对,提高数据效率和策略的鲁棒性。在RL过程中,智能体通过多次尝试和反馈,逐步优化其决策策略,最终实现高效的多步推理和信息检索能力。

四、应用场景与价值

  • 学术研究:WebAgent能够帮助研究人员快速获取特定领域的最新研究成果,提高信息检索效率和研究报告的全面性和精准性。

  • 市场分析:WebAgent的多步推理能力使其能够整合不同来源的信息,为市场分析提供有力支持。

收缩
  • QQ咨询

  • 电话咨询

  • 18576370666
  • 添加微信客服