
美团 LongCat 团队研发的 VitaBench(Versatile Interactive Tasks Benchmark)正式发布,这是当前高度贴近真实生活场景所面临复杂问题的大模型智能体评测基准。VitaBench 以外卖点餐、餐厅就餐、旅游出行三大高频真实生活场景为典型载体,构建了包含 66 个工具的交互式评测环境,并进行了跨场景的综合任务设计,例如要求 agent 在一个旅行规划任务中通过思考、调用工具和用户交互,完整执行到买好票、订好餐厅的终端状态。
本文介绍了美团技术团队在国际顶会 ICCV 2025 中发表的 5 篇论文。同时,在ICCV 2025 举办的多模态推理竞赛中,美团基础研发平台/计算和智能平台组建的 ActiveAlphaAgent 团队,斩获赛题 1 真实场景视觉定位(VG-RS)冠军,赛题 2 空间感知视觉问答(VQA-SA)季军和赛题 3 创意广告视频视觉推理(VR-Ads)季军。本文也分享了这三道赛题的解题思路,希望相关研究能给同学们带来一些帮助或启发。
| 备案号 | 主办单位名称 | 主办单位性质 | 审核时间 |
|---|---|---|---|
| 京ICP备10211739号-1 | 北京三快科技有限公司 | 企业 | 2019/4/29 12:36:07 |

数据统计
数据评估
关于美团技术团队特别声明
本站鸟瑞导航提供的美团技术团队数据都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由鸟瑞导航实际控制,在2025年9月6日 上午6:58收录时,该网页上的内容,都属于合法合规,后期网页的内容如出现违规,请联系本站网站管理员进行举报,我们将进行删除,鸟瑞导航不承担任何责任。
相关导航

Learn with interactive lessons and technical documentation, earn professional development hours and certifications, and connect with the community.

必应站长平台
使用 Microsoft 必应进行搜索,并利用 AI 的强大功能查找信息、浏览网页、图像、视频、地图等。为永远充满好奇心的人提供的智能搜索引擎。

百度指数
百度指数

搜狗站长平台
搜狗资源平台_公平开放的交流平台

Yandex站长平台

百度站长平台
百度搜索面向合作伙伴的官方平台,为开发者、内容创作者、站点管理者等伙伴,提供优化工具、数据、课程、Q&A等服务,助力资源进入搜索,同时提供搜索项目合作机会,让优质资源脱颖而出。

Visual Studio App Center
Continuously build, test, release and monitor apps for every platform.

谷歌站长平台
Google
暂无评论...


