FedGUI：跨异构平台、设备和操作系统对联合GUI代理进行基准测试

张开发

• 2026/6/23 20:09:21 • 15 分钟阅读

分享文章

摘要使用传统集中式方法训练 GUI 智能体面临高昂成本和可扩展性方面的巨大挑战。联邦学习提供了一种有前景的解决方案但由于缺乏能够捕捉真实世界跨平台异质性的基准其潜力受到制约。为弥补这一空白我们提出 FedGUI——首个用于在移动、网页和桌面平台上开发与评估联邦 GUI 智能体的综合性基准。FedGUI 提供了一套包含六个精心整理的数据集用于系统研究四种关键的异质性类型跨平台、跨设备、跨操作系统和跨数据源。大量实验揭示了若干关键发现首先跨平台协作能够提升性能将先前仅限移动设备的联邦学习扩展到了多样化的 GUI 环境其次我们证明了不同异质性维度的存在并识别出平台和操作系统是最具影响力的因素。FedGUI 为社区构建更可扩展、更保护隐私的、面向真实世界部署的 GUI 智能体提供了重要基础。代码和数据已公开获取。引言近期视觉语言模型的进展使得 GUI 智能体得以涌现这类智能体能够感知图形用户界面并通过顺序交互执行用户指令。传统上GUI 智能体的方法主要依赖集中式数据收集和人工标注。尽管有效但这种范式存在数据收集成本高、可扩展性有限的问题。与此同时GUI 设备的广泛、频繁使用天然产生了丰富的监督信号这些信号可作为训练 GUI 智能体的低成本数据源。然而这些真实世界的大规模数据尚未得到充分利用因为用户隐私问题使其无法公开共享。这促使我们采用一种分布式学习范式每个客户端在本地数据上训练无需直接传输数据。初期研究已通过联邦学习探索了这一方向以实现保护隐私的协同训练。FedMABench 是首个专为联邦移动智能体设计的基准但它局限于安卓用户之间的协作忽略了引入网页和桌面环境用户以进一步提升性能的巨大潜力。此外FedMABench 也未考虑设备、操作系统和数据源之间更广泛的异质性形式。这些局限引出了两个基本挑战其一如何实现跨平台的 GUI 智能体训练协作以及来自不同平台的扩展协作是否能提升性能其二如何定量刻画和衡量跨越不同平台、操作系统、设备和数据源的真实世界异质性为应对上述挑战我们提出 FedGUI一个面向跨平台、跨设备的分布式 GUI 智能体的综合性基准。FedGUI 具有三个关键特征多样性——FedGUI 覆盖了广泛的真实世界 GUI 环境包括 900 余个移动应用、四十余个桌面应用和二百余个网站。它同时支持多步骤任务和跨应用任务能够评估不同复杂度划分下的智能体性能。全面性——FedGUI 集成了七种代表性的联邦学习算法并支持二十余种基础模型包括最先进的开源视觉语言模型和专有模型。此外FedGUI 提供了一套全面的评估指标同时衡量任务性能和系统效率。异质性——FedGUI 建模了四种典型的真实世界异质性场景模拟用户在不同平台、设备和操作系统上协作的复杂性从而反映真实的部署情况。

更多文章

前端开发 2026/6/21 10:28:26

Zotero Reference：3分钟实现PDF参考文献自动提取的学术神器

Zotero Reference：3分钟实现PDF参考文献自动提取的学术神器【免费下载链接】zotero-reference PDF references add-on for Zotero. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-reference 还在为手动整理参考文献而烦恼吗？每次写论文都…

张开发

前端开发 2026/6/21 6:24:15

原边反激式AC/DC原理图设计

引言：AC/DC原理本设计是将220V交流电转变成稳定的5V直流。电路解析220V交流电输入后通过桥式整流得到高压直流。高频整流变压器分为三组线圈，1-2/7-8两组线圈将高压转换成低压。3-4为原边辅助线圈，通过二极管整流后获得辅助电压，用…

张开发

前端开发 2026/6/21 8:56:04

像素语言·维度裂变器：5分钟零基础部署，开启你的16-bit文本冒险

像素语言维度裂变器：5分钟零基础部署，开启你的16-bit文本冒险 1. 什么是像素语言维度裂变器像素语言维度裂变器是一款将文本改写与增强功能包装成16-bit像素冒险游戏风格的AI工具。它基于MT5-Zero-Shot-Augment引擎构建，能够将普通文本输入…

张开发

前端开发 2026/6/21 5:13:42

填坑实录：如何在RT-Thread的USB主机栈上，为STM32F429适配移远4G模组的RNDIS驱动

STM32F429与移远4G模组的RNDIS驱动开发实战去年冬天的一个深夜，当我盯着示波器上杂乱的USB数据包波形时，突然意识到——在RT-Thread上实现USB主机驱动RNDIS设备这件事，可能比想象中复杂得多。作为物联网设备开发者，我们常常面临这…

张开发

前端开发 2026/6/21 2:58:46

3步解决Photoshop迁移难题：PhotoGIMP完全指南

3步解决Photoshop迁移难题：PhotoGIMP完全指南【免费下载链接】PhotoGIMP A Patch for GIMP 3 for Photoshop Users 项目地址: https://gitcode.com/gh_mirrors/ph/PhotoGIMP 你是否曾因Photoshop的高昂费用而苦恼，却又担心切换到开源工具会失去熟…

张开发

前端开发 2026/6/11 15:53:03

手把手教你用HunyuanVideo-Foley镜像：RTX4090D环境配置与快速上手

手把手教你用HunyuanVideo-Foley镜像：RTX4090D环境配置与快速上手 1. 镜像概述与核心价值 HunyuanVideo-Foley是一款专为视频生成与音效生成任务优化的私有部署镜像，特别针对RTX 4090D显卡的24GB显存进行了深度优化。这个镜像的最大特点是开箱即用&…

张开发

前端开发 2026/6/11 16:01:55

MGeo模型效果展示：支持‘北京市海淀区五道口地铁站A口’等交通节点地址解析

MGeo模型效果展示：支持‘北京市海淀区五道口地铁站A口’等交通节点地址解析你有没有遇到过这样的场景？在网上看到一个活动地址是“海淀区五道口地铁站A口往东100米”，想在地图上搜索，却发现导航软件根本识别不了这么具体的描述。…

张开发

前端开发 2026/6/11 15:53:04

Java 高并发场景下 Redis 分布式锁（UUID+Lua）最佳实践

一、核心原理：Redis 分布式锁的设计基石1.1 分布式锁的核心要求一款可靠的分布式锁需满足以下 4 点核心要求，否则易引发死锁、锁误删、数据不一致等问题：互斥性：同一时间只有一个线程能持有锁，杜绝并发竞争&#xff1b…

张开发

前端开发 2026/6/11 15:53:04

conda源切换全攻略：从清华源到默认源的高效管理

1. 为什么需要切换conda源？ 刚开始用conda的时候，我经常遇到安装包速度慢到让人抓狂的情况。有一次安装TensorFlow，进度条几乎不动，等了两个小时才完成。后来才知道，conda默认使用的是国外服务器，国内用户直…

张开发

前端开发 2026/6/11 16:02:44

# Bug 报告：openai-codex provider broken since 2026.4.5 �� Cloudflare challenge + missing OAuth scope /

Bug 报告：openai-codex provider broken since 2026.4.5 �� Cloudflare challenge + missing OAuth scope / openai-codex provider broken since 2026.4.5 - Cloudflare challenge + missing OAuth scope 链接: https://blog.csdn.net/cosmoslife 作者: cosmoslife 日期: 2…

张开发