你的位置:开云(中国)kaiyun体育网址-登录入口 > 资讯 > 欧洲杯体育归拢SFT、跨模态RLHF和DMD等本领-开云(中国)kaiyun体育网址-登录入口

欧洲杯体育归拢SFT、跨模态RLHF和DMD等本领-开云(中国)kaiyun体育网址-登录入口

时间:2026-06-05 07:17 点击:81 次

欧洲杯体育归拢SFT、跨模态RLHF和DMD等本领-开云(中国)kaiyun体育网址-登录入口

凤凰网科技讯 6月3日,京东推出JoyAI-Echo长音视频生成框架。该框架平直处置了行业弥远存在的“长视频生成三浩劫题”——脚色易崩、声息乱变、生成逐步,并杀青了对话式剪辑功能。京东方面暗示,这记号着其在长视频生成边界投入环球第一梯队。

该框架包含四项中枢本领改进。一是跨模态音视频顾忌库,能在多镜头生成历程中合手续保存并调用脚色的外不雅特征和言语东谈主音色信息,在长达5分钟的视频中也能保合手身份、形象与声息的高度一致。二是顾忌运转后磨练,归拢SFT、跨模态RLHF和DMD等本领,仅DMD一项就杀青了约7.5倍的推理加快。三是Director Agent智能导演助理,用户用当然语言提倡需求,系统自动拆分红脚本、脚色和镜头,局部修改无需重跑整条视频。四是轻量化及时超分模块,复旧两档分离率普及,保险高清输出不卡顿。

为评估性能,议论团队基于100个故事、3000个镜头构建了专诚评测集。实测知道,JoyAI-Echo在跨镜头一致性、视频质地、文本一致性等中枢机议上均额外,其汉文音施行准确率高达0.8646。在用户偏好调研中,81.7%的用户以为其音频质地更优,80.6%以为请示词革职度更高,63.6%以为视觉好意思学更佳。

现在欧洲杯体育,JoyAI-Echo的代码与权重已一齐开源,名堂页和GitHub代码仓库已慎重上线,供诞生者和创作家体验及二次诞生。该框架可昔时期骗于假造故事创作、数字东谈主直播、品牌营销视频制作及影视前期预演等多个场景。

官网:
www.yaoqiangboli.com

地址:
资讯科技园7463号

Powered by 开云(中国)kaiyun体育网址-登录入口 RSS地图 HTML地图


开云(中国)kaiyun体育网址-登录入口-欧洲杯体育归拢SFT、跨模态RLHF和DMD等本领-开云(中国)kaiyun体育网址-登录入口