ChatGPT 的高级语音模式,Meta 刚刚发布了 SAM 2

谷哥 AI工具资讯评论20,823阅读模式




ChatGPT开始向一小部分 ChatGPT Plus 用户推出高级语音模式。高级语音模式提供更自然的实时对话,允许您随时打断,并能感知和响应您的情绪。此 Alpha 版用户将收到一封包含说明的电子邮件,并在其移动应用中收到一条消息。ChatGPT将继续滚动添加更多用户,并计划在秋季让 Plus 上的每个人都能使用。如前所述,视频和屏幕共享功能将推出。
ChatGPT 的高级语音模式,Meta 刚刚发布了 SAM 2

ChatGPT 的类似 Her 的语音模式

Crispy Bites: OpenAI开始推出先进的语音模式,让用户可以与 AI 进行更自然、互动的语音对话。
 

图片来源:OpenAI

重要见解:
  • 该功能最初将向一小部分 ChatGPT Plus 用户开放。
  • 高级语音模式提供更自然、实时的对话,允许您随时打断。
  • 它甚至可以检测你的情绪并做出反应。
OpenAI 在 5 月份的 GPT-4o 发布会上展示了该功能,但为了确保其满足高安全性和可靠性标准,该功能被推迟发布。OpenAI 决定推迟发布以进一步完善该功能。

了解 SAM 3:AI 细分的未来

图片来源:Meta

Crispy Bites: Meta 发布了 Segment Anything Model 2 (SAM 2),这是一种用于图像和视频中实时对象分割的新型 AI 模型。
详细:
  • 对象分割:您可以分割任何视频或图像中的任何对象。对象分割是识别图像中与感兴趣对象相对应的像素——这是计算机视觉领域的一项基本任务。
  • 真实世界用例:SAM 2 支持选择和优化任何视频帧中的对象。
  • 挑战和局限性: SAM 2 可能会遇到遮挡和拥挤场景的问题,但交互式功能有助于缓解这些问题。
  • 提高效率:与之前的最先进模型相比,SAM 2 在现有视频对象分割基准(DAVIS、MOSE、LVOS、YouTube-VOS)上表现出色。
SAM 2 及其数据集 SA-V 可在 Apache 2.0 和 CC BY 4.0 许可下使用。


如需帮助可点击网站右上方群链接,加入QQ群寻求帮助

weinxin
我的微信
我的微信
微信扫一扫
 
谷哥
  • 本文由 谷哥 发表于 2024年8月2日16:02:13
  • 转载请务必保留本文链接:https://liulingu.com/3434.html

发表评论