黑人亚洲人妻 最近更新|更新列表|字母检索|下载排行|苹果专区|分类导航

当前位置:首页电脑软件谢娜加入南山猎人 → 黑人亚洲人妻 v5.737.1408.10663 安卓汉化版

黑人亚洲人妻

黑人亚洲人妻

  • 电脑版下载
猜你喜欢
标签: 黑人亚洲人妻 香港精准三肖三码三期内必开APP
详情
介绍
猜你喜欢
相关版本

黑人亚洲人妻截图首次登录送91元红包

内容详情

黑人亚洲人妻

GELab-Zero团队 投稿量子位 | 公众号 QbitAI

首次将GUI Agent模型与完整配套基建同步开放,支持手搓党一键部署!

这就是阶跃星辰刚刚开源的GELab-Zero。

其中4B版本的GUI Agent模型在手机端、电脑端等多个GUI榜单上全面刷新同尺寸模型性能纪录,取得SOTA成绩。

随着AI在手机等消费终端的普及,Mobile Agent正从“能不能用”迈向“能否规模化落地”。

GUI Agent是执行能力最强的形态之一。它基于视觉理解即可适配几乎所有App,无需厂商额外改造,接入成本极低。

此外,阶跃还同步开源了基于真实业务场景的自建评测标准AndroidDaily,以期推动GUI领域模型评测向消费级、规模化应用发展。

同尺寸性能 SOTA,端到端、轻量化、速度快

要知道,让GUI Agent在不同品牌与系统版本的设备上顺畅运行并不轻松。

移动生态的高度碎片化让开发者需处理多设备ADB连接、依赖安装、权限配置、推理服务部署、任务编排与回放等繁琐流程,工程成本高昂,精力难以聚焦在策略创新与体验设计上。

要推动移动端Agent真正规模化,必须首先降低开发与使用门槛,让开发者专注于创造价值,而非重复搭建底层设施。

基于此,阶跃开源了GELab-Zero。

它主要包含三部分:

一个能在本地运行的GUI Agent模型GELab-Zero-4B-preview即插即用的完整推理工程基建,解决所有脏活累活基于真实业务场景的自建评测标准AndroidDaily

研究团队在ScreenSpot、OSWorld、MMBench、Android World多个开源基准测试上对GELab-Zero-4B-preview模型进行了全面评估。

这些基准测试涵盖了GUI理解、定位、交互等多个维度。

从测试结果可以看出,GELab-Zero-4B-preview在多项开源基准测试中超越其他主流模型,拿下同尺寸SOTA。

值得一提的是,GELab-Zero-4B-preview的表现还超越了参数量更大的GUI-Owl-32B等模型,性能更优,也更易部署。

来看一下研究团队给出的示例场景。

复杂任务

场景1:在外卖平台同时采购跨品类、不同规格和数量的商品。

Prompt:去饿了么离我最近的盒马鲜生购买:红颜草莓300g、秘鲁比安卡蓝莓125g(果径18mm)、当季新鲜黄心土豆500g、粉糯贝贝南瓜750g、盒马大颗粒虾滑、2瓶盒马纯黑豆豆浆300ml、小王子夏威夷果可可脆120g、盒马菠菜面、盒马五香牛肉、5袋好欢螺柳州螺狮粉(加辣加臭)400g、m&m’s牛奶巧克力豆100g

可以看到,模型精准识别了物品信息,并顺畅地完成了多步骤、重复性的购买操作。

场景2:在企业福利APP中领取餐券。

Prompt:打开给到App,在我的,下滑寻找,员工权益-奋斗食代,帮我领劵。

上述示例展示了GELab-Zero-4B-preview执行的能力和范围具有很强的泛化性,无论在国民级APP还是小众产品平台,都可以顺利完成任务。

模糊指令

场景1:在某个视频平台上播放指定演员的经典作品。

Prompt:在腾讯视频上找一部成龙的经典动作片播放。

接到指令后,GELab-Zero-4B-preview自主拆解“经典”这一需求,确定执行标准。

过程中,模型先打开腾讯视频,识别并关闭了弹窗,搜索“成龙”后在电影类目中选择了页面上成龙评分最高的代表作播放。

场景2:找一个周末能带孩子玩的地方。

Prompt:帮我找个周末能带孩子去玩的地方。

接到指令后,模型首先在内容平台搜索“北京周末带娃”,然后自主判断衡量标准后为用户推荐北京园博园“顽酷奇遇”,并为用户提炼出该地点的亮点——“有巨型装置卡通,亲子活动丰富”。

可以看到,GELab-Zero-4B-preview模型能够很好地执行复杂任务和模糊指令,不仅可以准确、流畅地执行涉及到多步骤、多主体、重复操作的任务,也能对“好看”“适合玩的”“经典”等偏笼统和主观性的指令进行自主拆解,确定执行路径和标准。

GUI+基建=GUI Agent MCP,一键拉起部署

针对GUI智能体,研究人员构建了一整套完整的技术架构体系,可以一键拉起获得类似开源GUI Agent MCP的体验。

具体能力如下:

轻量级本地推理支持4B模型在消费级硬件上运行,兼顾低延迟与隐私。一键任务启动提供统一部署流水线,自动处理环境依赖和设备管理。多设备任务分发可以分发到多台手机并记录交互轨迹,实现可观测、可复现。多种Agent模式涵盖ReAct闭环、多智能体协作以及定时任务等多种工作模式。

这些能力让GELab-Zero能够灵活应对真实场景的复杂任务流,并为后续扩展提供扎实底座。

Agent开发者可基于这套基建快速测试新想法、验证交互策略;企业级用户则能直接复用这套基建,将MCP能力快速植入到产品业务中。

自建并开源贴合真实业务场景的评测基准

此外,研究团队基于手机、IoT、汽车等行业头部公司的真实合作案例,建立了高度贴合业务场景的评测基准。

当前的主流基准测试,大部分聚焦于生产力类应用(如邮件与文档处理)。

然而在日常真实场景中,用户高频依赖的却是生活服务类应用,如外卖、打车、社交、支付等,而这部分场景不仅覆盖面更广,也更能体现当下GUI Agent 的实用价值。

为此研究者提出 AndroidDaily,一个面向真实世界、动态演进的多维基准体系。

它聚焦在现代生活六大核心维度:饮食、出行、购物、居住、信息消费、娱乐,并优先选择在这些类别中具有代表性(高频使用、应用商店日活排名靠前)的主流应用进行测试,高度还原真实任务执行流程(包括询问用户更多信息补充输入、高危操作请求用户接管)。

评测结果显示,GELab-Zero-4B-preview在AndroidDaily测试中准确率达到73.4% ,在移动端复杂任务中表现优秀。

为了平衡评估的全面性和执行效率,AndroidDaily采用了静态评测和端到端评测双轨评估体系。

静态评测考察模型的grounding(界面理解、元素识别)和action规划能力,用于检验其在推理与执行一致性等基础层面的表现。

端到端测试重点衡量GUI Agent在真实环境中处理复杂任务时的执行效果与稳定性。

其中,静态测试包含3146个actions,提供任务描述和逐步的屏幕截图,要求Agent预测每一步的动作类型和动作值(如点击坐标、输入文本),主要评估数值准确率。

这种方法无需复杂的工程基础设施,可以快速、低成本地进行大规模模型迭代和测试。

而端到端测试包含235个任务,典型任务场景包括出行交通(打车、导航、公共交通等)、购物消费(电商购物、支付、订单管理等)、社交通讯(消息发送、社交互动等)、内容消费(新闻阅读、视频观看、内容收藏等)、本地服务(外卖、到店服务)等。

在完全功能化的测试环境(如真实设备或模拟器)中进行,Agent需要从头到尾自主执行任务,最终以整体任务成功率作为评价指标,能真实反映智能体在复杂环境中的综合能力。

团队表示,希望通过GELab-Zero的开源,进一步降低移动端Agent的开发门槛,让更多开发者能够快速构建和验证自己的想法。

未来,研究团队将始终坚持开放、可控、隐私优先的原则,持续优化模型性能、扩展跨平台支持、丰富生态工具链。

GitHub:https://github.com/stepfun-ai/gelab-zero抱抱脸:https://huggingface.co/stepfun-ai/GELab-Zero-4B-preview

相关版本

    多平台下载

    • PC版

      黑人亚洲人妻 v9.170.3766 PC版

    • Android版

      黑人亚洲人妻 v9.150.5218.792856 安卓汉化版

    查看所有0条评论>网友评论

    发表评论

    (您的评论需要经过审核才能显示) 网友粉丝QQ群号:766969941

    查看所有0条评论>>

    相关软件
    白拍国产. 这里只有精品 向日葵视频app下载无限观看 动❌漫美女打扑克软🔞件下㊙️载 综琼瑶之容若下山 人与嘼在❌线🔞A片观看免费动漫 又大又长又深又粗的操逼视频 888888豆传媒app 女朋友喊疼男生的心理活动知乎 1外国操B视频 国产huangpian免费观看 蜜芽91com 国产Ⅹ性a夜 日韩色妞网一区二区三区 开车在车里 d故事 亚洲欧美福利一区二区三区 欧美日韩国产vA在线观看 女同18❌H动漫 丁香婷婷五月综合 一级毛片一级A片一级AⅤ 呆哥少妇兰兰 d2短视频app苹果下载 日本3㚫片不给费 福利电影500集 球员的娇妻未删减版在线观看中文 人人做人人爱黄色视频 激情乱伦小说图片网 女性吃了㫪药能自控吗 幸福宝app官网导入 10款免费流氓软件 少妇出轨(h)全文最新章节 丝瓜seo130下载app 91居家隔离时的好伙伴 色02看片 日韩人妻巨无霸水蜜桃 秋霞午夜国产 嗯…宝宝叫大声点,C视频 精品色欲色欲 永久免费观看的黄色小电影视频网站 黑土❌喷水自慰爽漫画 俄罗斯老太婆性色大BBBW在线播放 潮喷的视频色9 快人猫APP无限 钟离被❌各种姿🔞势c到高潮微博 午夜无码www 精品 欧美 亚洲 激情 ❌拳皇15夏尔米🔞被全㊙️人物大招打 糖心vlog视频湖南教育 俄罗斯老太太毛茸茸 免费强㢨appiOS免费 5177浮影路 男女动态图片 xxxwww黄片 www.hgjbav蝌蚪91 成年美女网站麻豆 激情-级毛片免费视频 ai❌聊天软🔞件没有屏蔽词免费 天美网站登录入口 丰满50m❌acbookpr🔞o高㊙️清 日韩精品无码免费午夜专区 中文人AV无码免费播放 麻豆蜜桃粉❌嫩🔞t㊙️V AVapp软件大全下载 亚洲AV❌无码乱码🔞国㊙️产一区二区 用母❌乳做🔞奶茶的柬埔寨人是谁㊙️ 激情视频免费 另类视频专区 欧美精品a片免观看 精品亚洲永久免费不卡 xzl仙踪林官方网址 亚洲仺Av香蕉久久 国产精品无码AV在线刺激 ❌被拿羽🔞毛笔折磨到㊙️失禁作文 人人拍人人操人人爽 久久无人爱高潮喷水毛片 外国性在线 ❌女裸自慰w🔞ww网站蜜桃传媒 一个在上面吃的两个在下㖭 91福利在线精品国产 日本欧美一级AAAAA毛 亚洲国产成人久久綜合一区 李丽莎无圣光 成人大片APP下载看污 榴莲视频app入口官网下载最新 小❌南大雷擦狙🔞狙的背景故事 啊嗯呢好紧双np 能看片的网站AV 艾玛沃特森艺术献❌身剧🔞情介绍㊙️ 五月国产在线播放大学生 四虎精品永久国产在线 西瓜视频丝瓜草莓视频app 4色aⅴ视频免费观看 ❌在🔞健身房被教练伦流㊙️澡到高潮小 欧美性a导航 宋雨琦被❌狂揉大胸 顶级欧美熟妇XXXXX欧美午夜剧场 亚洲午夜精品一区二区 美女X❌XX🔞XX㊙️18 🈲白丝袜极品www极品 欧美88综合网 欧美日韩中文字幕一区二区高清 欧美 另类 亚洲 自拍色图 538自拍视频 w❌ww.sa🔞o㊙️se いき❌の🔞こりぼくら歌曲㊙️ 免费久久精品国产片 黄色免费网站性交 91色㊙️乱码一区二区三区四区 桃子移植的1000款污污游戏 sigua555 app丝瓜 免费黄色视频在线网站 免费看黄片。 皮亚斯特里排名第三捷克爆乳 亚洲精品人妖 精品久久久久久无码永久 大雄❌伸手摸静🔞香内裤摸㊙️出水了漫画 小🐔🐔伸进🈲🔞🔞漫花在线观看 真实国产精品视频国产网 迷奸一级毛片 校花的腿张开给男生桶尤物 边做边爱视频播放
    热门网络工具