首页娱乐八卦京东发布JoyAI-Echo长视频生成框架：开源突破角色

京东发布JoyAI-Echo长视频生成框架：开源突破角色

2026-06-04 0

2026年6月3日，京东正式发布JoyAI-Echo长音视频生成框架，旨在系统性攻克当前长视频生成领域普遍存在的三大技术瓶颈：角色形象持续性不足、语音特征不稳定、整体生成效率偏低。

该框架的全部源代码与预训练权重现已全面开源，项目主页及GitHub代码仓库同步上线，面向开发者与内容创作者开放体验与二次开发权限。

JoyAI-Echo集成跨模态音视频记忆机制，在多镜头连续生成过程中可动态保存并精准复用角色的视觉表征与说话人声纹特征。实测表明，在长达五分钟的视频生成任务中，人物身份、外貌细节及音色特质均保持高度统一，有效杜绝角色在不同镜头间发生突兀变化的现象。

为兼顾生成质量与推理效率，框架采用记忆驱动的后训练范式，融合监督微调（SFT）、跨模态基于人类反馈的强化学习（RLHF）以及分布匹配蒸馏（DMD）技术。其中，DMD技术单独贡献约7.5倍的推理加速效果，显著提升长视频端到端生成吞吐能力。

系统内置智能导演助理模块，支持以自然语言输入创作意图，自动完成剧本解析、角色设定、场景划分与镜头调度。若某一段落生成结果未达预期，用户可通过对话方式直接指定修改范围，系统仅重生成对应镜头，无需整段视频重新计算。

评估环节，研究团队构建了涵盖100个原创故事、3000个独立镜头的长音视频专项评测集，从跨镜头一致性、画面质量、文本-视频对齐度及语音内容准确率等多个维度展开系统验证。结果显示，JoyAI-Echo在各项核心指标上均居行业前列，其中语音内容准确率高达0.8646，处于当前同类模型领先水平。

配图由人工智能生成

郑重声明：本站发布内容宗旨在传播更多信息，仅提供查阅，与本站立场无关，不拥有所有权，不承担相关法律责任。不具有任何效益，仅供参考。如果需要专业知识建议，请咨询相关专业人士。如有侵权请联系邮箱。一经查实，立即删除！

喜欢(0)

猫头鹰发布NL-LC1一体水冷及多款新品:2026–20

郭宇欣东北爱情往事2预约超250万：续集延续前作年代背景

大家都在看

《玫瑰的故事》：当你经历的男人足够多:就会发现:想让一个男人真心对你:最傻的方式是“无底线地讨好”:而最聪明的方式就是这样做

2026-07-22

贝塞斯达公布辐射系列新规划：上古卷轴6进展成玩家信任焦点

2026-07-18

破亿短剧改编院线：《好一个乖乖女》电影组讯上热搜

2026-07-20

世界表情包日：微信上线创意表情小程序：赋能用户自主创作与

2026-07-20

傅利叶推出GR-3人形机器人：全球首款真正居家管家级具身

2026-07-19

友情链接: 波波三国暗黑破坏神中文网易欧交易所阿里西西