谷歌刚刚推出了 ScreenAI,而且非常疯狂。这将永远改变用户体验的未来以下是保持领先地位所需的一切:
ScreenAI 是由 Google AI 开发的视觉语言模型 (VLM),可以理解用户界面 (UI) 和信息图表。它非常强大——能够执行图形问答、元素注释、摘要、导航和特定于 UI 的 QA 等任务。
它是如何工作的:就像一个超级强大的 UI 解释器一样,ScreenAI 使用两个阶段: - 预训练:应用自我监督学习来自动生成数据标签 - 微调:使用人工评分者手动标记的数据 以下是它的一些功能:
如需帮助可点击网站右上方群链接,加入QQ群寻求帮助
我的微信
我的微信
微信扫一扫
评论