9 月 13 日(路透社)——周五,人工智能研究员李飞飞和三位同事创办的一家初创公司筹集了 2.3 亿美元,旨在开发能够理解三维物理世界如何运作的人工智能技术。
World Labs 的初始资金由 Andreessen Horowitz、New Enterprise Associates 和 Radical Ventures 联合领投。其他投资者包括 AMD (AMD.O),风险投资,英特尔(INTC.O),打开新标签页Capital 和 Nvidia (NVDA.O),NVentures。
AI教母李飞飞打造3D人工智能世界
人工智能领域的知名人物李飞飞刚刚为她的新公司World Labs筹集了 2.3 亿美元。这家初创公司旨在开发能够理解我们周围的 3D 世界并与之互动的人工智能技术。
详细:
- 主要投资: World Labs 已经吸引了 Andreessen Horowitz、New Enterprise Associates、AMD Ventures 和 Nvidia 的 NVentures 等知名公司的大量资金,共筹集了 2.3 亿美元。
- 专注于 3D 空间智能:这家初创公司的目标是创建“大型世界模型”(LWM),以掌握 3D 环境的复杂性。这项技术可以为增强现实 (AR)、虚拟现实 (VR) 和机器人技术的发展铺平道路。
- 高级模型训练:通过混合使用合成数据和现实世界数据,World Labs 计划开发基于类似于 OpenAI 的 ChatGPT 的变压器架构的 AI 模型,但具有独特的增强功能以捕捉 3D 空间的细微差别。
- 领导层:李飞飞,通常被称为“人工智能教母”,正在领导这个雄心勃勃的项目,同时继续在斯坦福大学工作。与她一起加入的还有联合创始人贾斯汀·约翰逊、克里斯托夫·拉斯纳和本·米尔登霍尔,他们都是计算机视觉方面的专家。
World Labs 将通过赋予 AI 理解三维世界的能力来突破 AI 的界限。这一突破将为 AR、VR 等领域带来新的可能性,让我们更接近 AI 与环境无缝互动的未来。
Mistral AI 推出 Pixtral 12B
Mistral AI 凭借其新模型 Pixtral 12B 进入了多模式 AI 领域。这种先进的模型结合了语言和视觉处理,提供了通过文本提示分析和与图像交互的功能。
详细信息:
- 图像和文本处理: Pixtral 12B 允许用户上传图像或分享图像链接,并使用文本提出问题。它旨在分析和理解图片以及文本提示。
- 先进的设计:该模型有 40 层,可以处理高达 1024x1024 的高分辨率图像。它专为处理细节丰富的图像而设计,因此比许多其他模型更加通用。
- 特殊功能:与其他模型不同,Pixtral 无需额外设置即可处理多张不同大小的图像。目前可在 Hugging Face 和 GitHub 上下载,计划很快将其添加到 Mistral 的 Web 聊天机器人和 API 中。
- Mistral 的快速增长:此次发布是 Mistral 最近获得 6.4 亿美元融资并发布其他产品(如 Mistral Large 2)之后推出的。该公司一直与微软和 AWS 等大公司合作,以扩大其 AI 技术覆盖范围。
Pixtral 12B 表明 Mistral AI 专注于打造强大的文本和图像处理工具。虽然该模型的全部潜力尚未得到充分挖掘,但这是一个重要的步骤,可以通过提供更灵活和更先进的选项来挑战 AI 行业的其他大公司。
使用 Zeemo 自动为视频添加字幕
Zeemo 是一款人工智能工具,可自动为视频生成字幕,增强可访问性和观众参与度。
步骤:
- 注册并登录:访问Zeemo网站,注册账户并登录即可访问字幕平台。
- 上传您的视频:单击“上传视频”并选择您想要添加字幕的视频文件。
- 选择语言:选择视频的语言以确保准确生成字幕。
- 生成字幕:单击“生成字幕”即可让 AI 自动为您的视频创建字幕。
- 编辑和下载:查看并根据需要编辑字幕。满意后,下载带字幕的视频或导出字幕文件。
如需帮助可点击网站右上方群链接,加入QQ群寻求帮助
继续阅读
我的微信
我的微信
微信扫一扫
评论