”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 科技周边 > 阿里云宣布自研 EMO 模型上线通义 App,用照片 + 音频生成唱歌视频

阿里云宣布自研 EMO 模型上线通义 App,用照片 + 音频生成唱歌视频

时间:2024-04-25 22:42:14
浏览:339 来源:https://www.ithome.com/0/764/250.htm

大家好,今天本人给大家带来文章《阿里云宣布自研 EMO 模型上线通义 App,用照片 + 音频生成唱歌视频》,文中内容主要涉及到,如果你对文章方面的知识点感兴趣,那就请各位朋友继续看下去吧~希望能真正帮到你们,谢谢!

“本站4月25日消息,EMO(Emote Portrait Alive)是一个由阿里巴巴集团智能计算研究院开发的框架,一个音频驱动的AI肖像视频生成系统,能够通过输入单一的参考图像和语音音频,生成具有表现力的面部表情和各种头部姿势的视频。”

阿里云今日宣布,通过实验室研发的 AI 模型 —— EMO 正式上线通用 App,并开放给所有用户免费使用。借助这一功能,用户可以在歌曲、热梗、表情包中任选一款模板,然后通过上传一张肖像照片就能让 EMO 合成演唱视频。

阿里云宣布自研 EMO 模型上线通义 App,用照片 + 音频生成唱歌视频

根据介绍,通义 App 首批上线了80多个 EMO 模板,包括热门歌曲《上春山》《野狼 Disco》等,还有网络热梗“钵钵鸡”“回手掏”等,但目前暂未提供自定义音频。

本站附 EMO 官网入口:

  • 官方项目主页:https://humanaigc.github.io/emote-portrait-alive/

  • arXiv 研究论文:https://arxiv.org/abs/2402.17485

  • GitHub:https://github.com/HumanAIGC/EMO(模型和源码待开源)

阿里云宣布自研 EMO 模型上线通义 App,用照片 + 音频生成唱歌视频

EMO 的主要特点

  • 生成EMO音频的视频:EMO能够根据输入的音频(如对话或歌曲)直接生成视频,无需依赖于预先录制的视频片段或3D面部模型。

  • 高表现力和逼真度:EMO 生成的视频具有高度的表现力,能够捕捉并再现人类面部表情的细微差别,包括微妙的微表情,以及与音频节奏相匹配的头部运动。

  • 无缝帧过渡:EMO 确保视频帧之间的过渡自然流畅,避免了面部扭曲或帧间抖动的问题,从而提高了视频的整体质量。

  • 身份保持:通过 FrameEncoding 模块,EMO 能够在视频生成过程中保持角色身份的一致性,确保角色的外观与输入的参考图像保持一致。

  • 稳定的控制机制:EMO 采用了速度控制器和面部区域控制器等稳定控制机制,以增强视频生成过程中的稳定性,避免视频崩溃等问题。

  • 灵活的视频时长:EMO 可以根据输入音频的长度生成任意时长的视频,为用户提供了灵活的创作空间。

  • 跨语言和跨风格:EMO 的训练数据集涵盖了多种语言和风格,包括中文和英文,以及现实主义、动漫和 3D 风格,这使得 EMO 能够适应不同的文化和艺术风格。

以上就是《阿里云宣布自研 EMO 模型上线通义 App,用照片 + 音频生成唱歌视频》的详细内容

版本声明 本文转载于:IT之家如有侵犯,请联系study_golang@163.com删除
最新教程 更多>
  • 深圳建成汽车超级充电站 362 座,数量超过加油站
    深圳建成汽车超级充电站 362 座,数量超过加油站
    深圳市发展和改革委员会表示,本站5月4日消息,截至4月30日,深圳市已累积建成超级充电站362座,数量超过传统加油站,充电枪数量也已超过加油枪。同时,充电枪数量也已超过加油枪。自从去年6月29日宣布启动“超充之城”建设以来,深圳应用超充技术,推广超充设施,布局超充站点的进程稳步推进。目前,已经初步建设遍布全城的超充服务网络。这些站点大多依托原有的公共充电站建设,分布在大型商业综合体、公交场站、产业园区等。《深圳市新能源汽车超充设施专项规划(2023—2025年)》提出,力争到今年底,建成技术全球领先、场景
    科技周边 发布时间:2024-05-04
  • 国铁集团 2023 年总收入 1.25 万亿元,净利润 33 亿元双双打破历史纪录
    国铁集团 2023 年总收入 1.25 万亿元,净利润 33 亿元双双打破历史纪录
    中华人民共和国国家铁路集团有限公司公布了2023年经营业绩,这也是国铁集团历史上业绩最好的一年,总收入与净利润双双打破历史纪录。根据提供的数据,2023年国铁集团总收入增长10.62%,净利润由负转正且首次突破30亿元,达到33.04亿元。这两项数据均超过了2019年的最佳表现,其中2019年总收入增长10.62%,利润增长25.24%。与2019年相比,2023年分别增长了10.62%和30.90%。国铁集团宣布,武广高铁、沪杭客专、沪昆客专、杭甬客专等4条高铁票价将于6月开始涨价,票价窗口将上调19%
    科技周边 发布时间:2024-05-04
  • 告别“诺基亚”马甲:HMD 定制手机 M-Kopa X2 手机基于自家 Pulse 系列机型打造
    告别“诺基亚”马甲:HMD 定制手机 M-Kopa X2 手机基于自家 Pulse 系列机型打造
    本站5月4日消息,早在HMDGlobal发布“首款自有品牌手机”HMDPulse前,该公司便联合一家在非洲肯尼亚提供金融服务的公司“M-Kopa”推出了一款带有HMD徽标的定制机“M-KopaX1”,这款手机是诺基亚C32智能手机的“马甲版”。目前Geekbench跑分显示,HMDGlobal正与“M-Kopa”公司联合打造M-KopaX2手机,这款手机搭载Android14系统,基本是HMDPulse手机的换标版本,该机同样搭载紫光展锐T606处理器,单核跑分为379分,多核跑分为1349分。本站附HM
    科技周边 发布时间:2024-05-04
  • 耗时 4 年开发,蝠鲼水下自主无人机完成初步测试:探索人类无法到达的水下世界
    耗时 4 年开发,蝠鲼水下自主无人机完成初步测试:探索人类无法到达的水下世界
    本站5月4日消息,诺斯罗普・格鲁曼公司经过大约4年的努力,终于设计制造出美国国防高级研究计划局(DARPA)要求的蝠鲼水下自主无人机,并于近日成功在南加州海岸测试了原型机。DARPA制定了蝠鲼计划,希望开发能够在水下操作的新一代自主无人机,被设计用于在海洋中执行长时间、远程任务,探索人类无法到达的环境。本站附上相关测试图片如下:[图片链接]。DARPA选择了3家承包商,除了诺斯罗普·格鲁曼公司之外,还有马丁防务集团和Metron两家公司,但Metron于2021年宣布退出该计划。{"role":"user
    科技周边 发布时间:2024-05-04
  • 理想 L6 车型上市 16 天累计定单突破 3 万台
    理想 L6 车型上市 16 天累计定单突破 3 万台
    本站5月4日消息,理想汽车官方宣布:全新理想L6上市16天,累计订单已突破30,000台。五一节假日期间,理想汽车交付中心正常交付。理想汽车同时推出限时价值20000元购车权益,即刻起至2024年5月5日24:00订购的用户可享:5000元定金抵扣10000元购车款价值10000元的特殊颜色或21英寸轮毂选装基金价值5000元的7kW交流充电桩及安装服务理想L6汽车的长宽高分别为4925mm、1960mm和1735mm,轴距为2920mm。该车配备15.7英寸LCD双联屏(3K分辨率),内置高通骁龙829
    科技周边 发布时间:2024-05-04
  • PC 版《对马岛之魂》多人模式需绑定 PSN 账号,单人游戏无需
    PC 版《对马岛之魂》多人模式需绑定 PSN 账号,单人游戏无需
    本站5月4日消息,索尼SIE日前宣布《绝地潜兵2(地狱潜者2)》PC版5月30日起需要强制绑定PSN账号才能游玩,这一消息引起了许多PC玩家的不满。今天索尼旗下即将在PC平台发布的大作《对马岛之魂》也对在线条款进行更新,宣布玩家需要绑定PSN账号后才能游玩在线多人模式,不过单人模式无需绑定PSN账号。请注意,《对马岛之魂》将于5月16日登陆PC平台,由Nixxes负责移植工作,首发将支持DLSS3和FSR3.0技术,该游戏配置信息如下:最低:预设“最低”,720P30帧,CPU需酷睿i3-7100或AMD
    科技周边 发布时间:2024-05-04

免责声明:提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:lupingnet@sina.com 我们会在看到邮件的第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3