本周人工智能和机器人技术取得重大进展。 Apple、OpenAI、Luma Labs、NVIDIA、斯坦福、诺斯罗普·格鲁曼、Google DeepMind、Stability AI 和 Microsoft 的重大进展。 以下是发生的一切以及如何理解它:
1.苹果在 WWDC 上透露 Apple Intelligence:苹果首个 AI 系统即将登陆 iPhone、iPad 和 Mac。 这是 iPad 的众多新功能之一:将计算器用作记事本并获取数学问题的实时答案
2.Apple 和 OpenAI 还宣布建立合作伙伴关系,将 ChatGPT 直接集成到 iOS 18、iPasOS 18 和 macOS 中 这包括更智能的 Siri、图像和文档理解等功能,无需在不同工具之间切换
3.Luma Labs 推出了 Dream Machine,这是一种新的 AI 模型,可以根据文本和图像提示生成 5 秒的视频剪辑。 它已经向公众开放,用户可以获得 10 个免费积分 这是 Luma 与 OpenAI 的 Sora 的并排比较
4.周五,NVIDIA 发布了自己的开源模型 Nemotron-4 340B 它是一系列开放模型,用于生成用于商业应用训练LLMs的合成数据
5.斯坦福大学的研究人员推出了“HumanPlus” 这是一个实时阴影系统,供人形机器人使用 RGB 摄像头克隆人体运动 从类人机器人的角度收集数据,然后用于使机器人具有自主性
6.诺斯罗普·格鲁曼公司发布了“蝠鲼”的新视频,它是新型无人水下航行器 (UUV) 无人机原型 蝠鲼将在“人类无法到达”的海洋环境中执行长期、远程任务
7.DeepMind 和哈佛大学创造了一种由人工智能神经网络驱动的“虚拟啮齿动物”。 它能够模仿现实生活中老鼠的敏捷运动和神经活动。 这将开启对人工智能动物进行测试的新研究,并扩展到机器人技术
8.OpenAI 董事会增加了退役美国陆军将军、前国家安全局局长 Paul M. Nakasone 的成员 Nakasone曾在 2018 年至 2023 年间领导美国国家安全局,将帮助提高人工智能在网络安全中的作用,并保护 OpenAI 免受不良行为者的侵害
9.研究人员开发了一种名为“DenseAV”的人工智能算法 它可以通过观看未标记的视频来学习语言的含义和声音的位置 这可以帮助我们更好地理解动物交流,并可能发现新的语言
10.研究人员推出了 OpenVLA:一种用于机器人技术的开源视觉-语言-动作模型 这是一种新的开源 7B 参数机器人基础模型,尽管尺寸小了近 10 倍,但其性能优于闭源 55B 参数 RT-2-X 模型
11.Stability AI 发布了其文本到图像模型的开放模型权重,Stable Diffusion 3 Medium 2B 参数模型提供先进的照片级真实感、即时理解和排版功能
12.Apparate Labs 是斯坦福大学研究人员创办的一家新初创公司,推出了名为 PROTEUS 的实时 AI 视频生成模型。 与 VASA-1 类似,它可以从单个参考图像创建逼真的头像和口型同步,但完全实时。
13.研究人员利用类人机器人提出了一种自动驾驶的新方法 该机器人能够操作方向盘、油门和刹车,根据摄像头、麦克风和触摸传感器的反馈传感器调整动作
这就是本周的人工智能和机器人细分。
如需帮助可点击网站右上方群链接,加入QQ群寻求帮助
继续阅读
我的微信
我的微信
微信扫一扫
评论