Meta Reality Labs 推出了 Sapiens,这是一套用于四项以人为中心的基本视觉任务的模型系列 - 2D 姿势估计、身体部位分割、深度估计和表面法线预测。我们的模型原生支持 1K 高分辨率推理,并且非常容易通过对超过 3 亿张自然人类图像进行预训练的模型进行微调来适应单个任务。即使在标记数据稀缺或完全合成的情况下,生成的模型也表现出对自然数据的出色泛化能力。我们简单的模型设计还带来了可扩展性 - 随着我们将参数从 0.3 扩展到 20 亿,跨任务的模型性能得到提高。Sapiens 在各种以人为中心的基准测试中始终超越现有基线。
Meta 推出视觉分析模型 Sapiens
Meta Reality Labs推出了一系列名为“ Sapiens ”的人工智能模型,专为高分辨率环境下的高级人类视觉任务而设计。这些模型特别擅长理解图像或视频中的人类动作。
详细信息:
- 模型能力:Sapiens 模型擅长识别人体姿势、分割身体部位、估计深度以及确定图像中物体表面的角度。
- 数据处理:该模型在“Humans-300M”数据集上进行了预先训练,该数据集包含大量“野生”人类图像,确保学习材料多样而全面。
- 技术创新:这些模型支持高分辨率图像处理,并能以最少甚至合成的数据高效工作,使其高度适应实际应用。
- 架构:Sapiens 使用 Vision Transformers (ViT) 架构,使其能够有效地管理高分辨率输入。该模型的编码器-解码器结构可实现详细的图像特征提取和特定任务执行。
- 应用:可用于监控、虚拟现实和医疗康复,可精确分析人体姿势和运动等。
Meta Reality Labs 的 Sapiens 模型代表了人工智能驱动的人类视觉技术的一次飞跃。通过对图像和视频中的人像进行细致入微的理解和分析,这些模型为各个行业开辟了新的可能性,增强了人工智能在现实场景中的功能和应用。
Mistral AI 挑战 Meta 和 OpenAI
Mistral AI推出了名为“Large 2”的新 AI 模型,直接挑战 OpenAI 和 Meta 的最新模型。此版本凸显了 AI 能力的重大进步,特别是在代码生成和数学推理方面
详细信息:
- Large 2 仅有 1230 亿个参数,不到 Llama 3.1 405B 大小的三分之一,但它声称在代码生成和数学等领域的表现优于 Llama 3.1。
- 该模型支持12种语言、80种编码语言的多语言处理,通用性很强。
- Mistral 对 Large 2 进行了定制,以减少 AI 模型中常见的幻觉,确保其提供准确且相关的反应。
Mistral 的新 Large 2 模型表明,人工智能既强大又高效。它旨在处理大型任务,而无需太多计算机能力,这可以让更多公司和开发人员使用先进的人工智能工具。这是让人工智能在日常应用中变得更智能、更有用的重要一步。
利用多种人工智能增强电子表格
Numerous AI 是 Google Sheets 和 Excel 的附加组件,它集成了 ChatGPT,可让您使用 AI 驱动的功能自动化和增强电子表格任务。
请遵循以下步骤:
- 安装 Numerous AI:从相应的附加组件商店将Numerous AI添加到 Google Sheets 或 Excel。
- 激活 Numerous AI:打开电子表格并通过“附加组件”或“扩展”菜单激活 Numerous AI 附加组件。
- 使用 AI 函数:开始使用 AI 函数(如 =AI())直接在电子表格中生成文本、摘要或数据分析。
- 自定义公式:创建自定义公式以应用 AI 驱动的洞察力或根据您的特定需求自动执行重复任务。
- 分析和优化:使用大量人工智能来分析数据趋势、生成报告或优化电子表格中的内容。
如需帮助可点击网站右上方群链接,加入QQ群寻求帮助
评论