夜间模式 切换到宽版

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 130|回复: 6

[数码资讯] 讯飞星火多模态交互大模型上线,数字人、语音、视觉支持一键调用

[复制链接]
  • 打卡等级:功行圆满
  • 打卡总天数:840
发表于 2024-11-15 08:25 | 显示全部楼层 |阅读模式

马上注册,查看更多内容,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

×
“讯飞开放平台”公众号今天傍晚宣布,讯飞星火多模态交互大模型正式上线,其实现从语音交互拓展到音视频流实时多模交互,新增“多模态、超拟人和个性化”能力,实现语音、视觉、数字人交互三合一,支持一键调用。



据介绍,讯飞星火多模态交互大模型首发超拟人数字人技术,数字人躯干和四肢动作能够精准匹配语音内容,快速生成表情和动作,令 AI“栩栩如生”。通过统一文本、语音和表情,能够实现跨模态的语义一致性,从而使大模型情感表达真实连贯。

其支持超拟人极速交互,采用统一神经网络直接实现语音到语音的端到端建模,响应更快速、流畅,可敏锐感知情绪变化,也可根据指令自由变换声音的节奏、大小和人设。

其支持多模态视觉交互,能够“听懂世界”“认清万物”,更全面感知具体背景场景、物流状态等信息,对任务的理解更加精准,并通过语音、手势、行为、情绪等进行综合判断,作出合适的回复。

据IT之家此前报道,用户可与数字人进行语音、视频通话,数字人可实现与用户的自然语音对话,人物表情等也能够匹配说话的语句。星火超拟人数字人还支持多模态交互,可让数字人识别摄像头中的内容,比如孙悟空和奥特曼站在一起、面霜的品牌和作用、花的品类等。
  • 打卡等级:已臻大成
  • 打卡总天数:659
发表于 2024-11-15 08:40 | 显示全部楼层
感谢分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:已臻大成
  • 打卡总天数:535
发表于 2024-11-15 10:48 | 显示全部楼层
感谢楼主分享!
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:843
发表于 2024-11-15 10:53 | 显示全部楼层
看看新闻资讯,感谢分享
回复 支持 反对

使用道具 举报

  • 打卡等级:功行圆满
  • 打卡总天数:827
发表于 2024-11-15 12:04 | 显示全部楼层
谢谢楼主分享。
回复 支持 反对

使用道具 举报

  • 打卡等级:炉火纯青
  • 打卡总天数:81
发表于 2024-11-15 12:10 | 显示全部楼层
谢谢楼主分享
回复 支持 反对

使用道具 举报

  • 打卡等级:自成一派
  • 打卡总天数:245
发表于 2024-11-16 11:18 | 显示全部楼层
不管你信不信,反正我是信了。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

文字版|手机版|小黑屋|RSS|举报不良信息|精睿论坛 ( 鄂ICP备07005250号-1 )

GMT+8, 2026-6-17 07:03 , Processed in 0.418356 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2026 Discuz! Team.

快速回复 返回顶部 返回列表