🎥 AI视频模型动态
1. NAB 2026:AI视频工具从”实验”走向”标配”
NAB 2026展会今日正式开放,AI视频工具全面亮相。关键信号:Mediaproxy AI Logo检测(自动品牌识别)、Vizrt AI Keyer(无绿幕虚拟制作)、PTZOptics×Moondream(AI视觉推理驱动直播)、Atomos Sumo PRO-19(19寸4K HDR多机位监看)。AI视频不再只是”生成一段视频”,而是”替代整个视频生产链”中的每一个环节
🔗 TV Tech | Content+Tech | RedShark
2. OpenAI Codex加入图片生成能力——AI视频创作的”最后一公里”正在被填上
OpenAI在Codex更新中加入了图片生成功能。虽然Codex主打编码,但”AI在桌面端同时具备代码生成+图片生成+Computer Use”的能力组合,意味着”一个人+一个AI”就能完成从设计到开发到测试的全流程。对AI视频创作者来说,这意味着”文案→分镜→素材→剪辑”的链条可能很快被一个统一的AI Agent打通
💬 AI视频赛道的三个信号:制作环节AI化(NAB 2026)、生成能力桌面化(Codex图片生成)、工作流代理化(Computer Use)——2026年的AI视频不再是”能不能生成”的问题,是”能不能端到端自动化”的问题
1. NAB 2026:AI视频从”生成内容”进化到”替代工作流”
NAB 2026(4月18-22日)今日开幕,AI视频工具全面爆发。三大信号:Vizrt AI Keyer取消绿幕(虚拟制作民主化)、PTZOptics×Moondream视觉推理做AI体育直播(自动化直播)、Wowza Video Intelligence Framework(视频基础设施AI化)。AI视频不再只是”生成一段视频”,而是”替代整个视频生产链”
🔗 TV Tech | Broadcast Beat | Wowza | V-Nova
2. Etere将在NAB BEIT Conference对比Grok/GPT/Gemini/DeepSeek的广播能力
Etere将在NAB 2026的BEIT Conference上发表演讲,系统对比四大模型在日常广播任务中的表现——这是首次有厂商做”大模型广播能力横评”。结果将直接影响影视行业对AI模型的选择
💬 AI视频赛道的三个信号:虚拟制作民主化(Vizrt)、直播自动化(PTZOptics)、基础设施AI化(Wowza)——2026年的AI视频不再是”生成”的问题,是”整合”的问题
1. 阿里Happy Oyster”世界模型”发布:从文本生成可交互3D世界,目标游戏和影视制作
阿里4月16日发布Happy Oyster,定位”世界模型”。核心能力:文本→3D环境+交互式视频,模拟真实物理。支持电影制作、视频内容、游戏开发。目前限制:1-3分钟会话、480p/720p输出。在OpenAI Sora关闭后,Happy Oyster填补了”AI生成可交互3D内容”的市场空缺
2. NAB 2026:Wowza展示AI驱动的视频工作流,Sony发布AI摄像机PXW-Z300
NAB 2026(4月18-22日,拉斯维加斯)即将开幕,多个AI视频工具提前曝光。Wowza将演示AI驱动的视频基础设施升级;Sony发布首款搭载AI的新闻手持摄像机PXW-Z300;PROMISE Technology展示AI优化存储方案
🔗 Video Production News | TV Tech | PR Newswire
💬 AI视频赛道的三个信号:世界模型化(Happy Oyster)、工具链化(NAB上的Agentic AI)、硬件化(Sony AI摄像机)——2026年的AI视频不再是”生成一段视频”,而是”重塑整个视频产业链”
1. Artificial Analysis AI视频排行榜更新:HappyHorse 1.0继续领跑,Kling 3.0 Omni杀入前五
最新Text-to-Video排行榜(含音频):HappyHorse 1.0(阿里巴巴)Elo 1227 #1,Seedance 2.0 720p(字节)1222 #2,SkyReels V4(昆仑万维)1137 #3,Kling 3.0 Omni 1080p Pro(快手)1101 #4,Kling 3.0 1080p Pro 1100 #5。Kling 3.0 Omni的亮点是原生音视频同步+1080p分辨率,直接对标HappyHorse
2. OpenMontage开源Agentic视频制作系统上线:集成12条管线+52个工具
GitHub上出现的OpenMontage项目将AI编码助手变为完整视频制作工作室。支持FAL、Suno、ElevenLabs、OpenAI、HeyGen、Runway等几乎所有主流AI创作工具的统一编排
🔗 GitHub
3. Kling 3.0 Omni发布:快手AI视频的”全能版”——1080p+原生音视频同步
快手Kling 3.0 Omni版本在Artificial Analysis上获得Elo 1101分,进入全球前五。Omni版本的核心升级是原生音视频同步能力,支持在生成视频的同时生成同步音频
💬 AI视频赛道的三个信号:开源化(OpenMontage)、全能化(Kling 3.0 Omni)、一体化(HappyHorse的统一Transformer)——2026年的AI视频不再是”生成一段视频”,而是”制作一部影片”

1. HappyHorse 1.0登顶Artificial Analysis Video Arena:阿里巴巴匿名发布后开源
150亿参数统一Transformer,T2V Elo 1333 #1,I2V Elo 1392 #1。支持7种语言唇形同步,8步DMD-2蒸馏,MagiCompiler加速。完全开源(基础模型+蒸馏模型+超分模块+推理代码),商用许可
🔗 HappyHorse官网 | HuggingFace | Bloomberg
2. Google DeepMind发布Gemini Robotics-ER 1.6:机器人具身推理能力大幅提升
Instrument Reading成功率从23%飙升至93%,与Boston Dynamics Spot深度集成,实现工业设施自主巡检。空间指向、多视角检测等核心能力全面提升
🔗 DeepMind Blog | Boston Dynamics
3. HONOR 600系列将AI Image to Video 2.0带入手机端:一键照片转视频
荣耀600系列搭载专用AI按钮,一键将静态照片转为动态视频。AI视频生成从”云端专业工具”向”手机端一键功能”下沉
🔗 GSMArena
💬 AI视频赛道的三个信号:开源化(HappyHorse)、专业化(Gemini Robotics)、大众化(HONOR 600)——三个方向同时推进,2026下半年将是AI视频的”爆发季”

1. Seedance 2.0多主体一致性控制和微表情控制成为创作者标配 B站上”豆包+即梦+剪映”工作流教程密集发布,AI视频制作进入”2小时速成”时代。多主体一致性控制和人物微表情控制是Seedance 2.0最受关注的能力 🔗 B站
2. AI漫剧出海加速:TikTok短剧Q1分账2400万美元,AI短剧增幅超6倍 利欧股份推出Mantur平台,点众科技发布”双十亿”AIGC共创计划。AI视频出海从”个人创作者试水”进入”平台化运营”阶段 🔗 新浪财经 | 网易
3. Martini AI节点工作流公测:生图→视频→声音→超分一站式 B站报道Martini AI发布节点工作流,打通了从图片生成到视频到声音到超分辨率的完整链路。AI视频制作的”全家桶”时代来临 🔗 B站
💬 AI视频赛道的三个趋势:工具门槛降低(2小时速成)、出海加速(TikTok分账增长6倍)、工作流整合(一站式平台)——2026下半年将是AI视频的”平台大战”

1. Sora正式关停:25个月从封神到退场,OpenAI放弃视频生成转向Agent 3月25日OpenAI宣布关停Sora。Sora 2独立应用仅运营6个月。生命周期累计收入210万美元,年运行成本约50亿美元。OpenAI将资源转向编码工具、企业客户和AGI。中国AI视频公司迅速填补空白 🔗 科学网 | 观察者网
2. HappyHorse-1.0登顶后正式开源:阿里ATH的”匿名→登顶→认领”三部曲 阿里HappyHorse-1.0以1357分(文本到视频)登顶Artificial Analysis排行榜,甩开Seedance 2.0(1273分)84分。150亿参数,40层统一自注意力Transformer,单张H100生成5秒1080p视频仅需38秒。核心差异化:文本→同步生成视频+音频。4月10日正式认领并开源 🔗 CNBC | 钛媒体
3. Seedance 2.0 API全面开放公测:1元/秒,100万保证金 火山引擎宣布Seedance 2.0 API企业公测,全自动审核即时开通。定价约1元/秒,企业需签保底协议+100万保证金。此前因排队10万人、“降智”问题饱受争议 🔗 DoNews | CSDN
4. 可灵 vs Seedance:一个开放,一个收窄——AI视频的两条商业化路径 可灵走”无差别开放”路线,黄金会员66元/月,企业客户超2万家,ARR超3亿美元。Seedance走”筛选客户”路线,100万保证金+版权自担。两种路径的共同目标:从”炫技”到”生态” 🔗 DoNews

1. HappyHorse-1.0正式开源:全球首个音视频联合生成的开源模型
阿里ATH AI创新实验室的HappyHorse-1.0正式宣布开源。150亿参数,40层统一自注意力Transformer架构,单张H100上生成5秒1080p视频仅需约38秒。核心差异化:文本→同步生成视频+音频,不需要单独的音频处理管道。支持中英日韩等多语言提示词。社区分析发现其与GitHub开源模型”daVinci-MagiHuman”高度吻合 🔗 DoNews | 博客园 | 新浪财经
💬 开源的意义不是”免费”,是”可定制”——HappyHorse真正的价值在于,任何团队都可以基于它训练自己的音视频联合生成模型
2. Sand.ai创始人对话:当硅谷转向”世界模型”,中国视频公司选择先把钱赚了
网易订阅近日发表了与Sand.ai创始人的深度对话,揭示了中美AI视频模型的战略分化:硅谷公司(OpenAI、Google)追求”世界模型”(理解物理世界的通用模型),中国公司(阿里、字节、快手)则聚焦于”先做出能用的产品赚钱”。这种分化不是技术路线的差异,是商业环境的差异——中国AI视频市场的竞争更激烈、变现压力更大 🔗 网易
💬 “世界模型”vs”先把钱赚了”——两种路线没有对错,只有适不适合当前的市场环境。但长期看,只做应用不做基础研究的公司,最终会受制于人
3. AI视频模型的”版权困境”持续:Seedance 2.0推广受阻,训练数据争议升级
CNBC此前报道,字节跳动因与好莱坞主要制片厂和流媒体平台的版权纠纷,被迫暂停了Seedance 2.0的推广。与此同时,AI漫剧行业的”洗稿式”生成(大量使用既有影视剧截图作为素材)也引发版权争议。AI视频模型的训练数据合法性问题正在从”学术讨论”变成”商业风险” 🔗 CNBC
💬 AI视频模型的版权问题比AI文本更严重——因为视频训练数据里包含的画面,可能直接被”生成”为相似的画面

1. 阿里HappyHorse-1.0匿名登顶全球榜首:AI视频的”中国时刻”
4月7日,HappyHorse-1.0匿名出现在Artificial Analysis排行榜,迅速登顶T2V和I2V双料第一。4月10日揭晓身份:阿里ATH AI创新实验室。社区此前猜测它是WAN 2.7的马甲版本(WAN 2.6 Elo 1189远低于HappyHorse)。HappyHorse-1.0由文本描述联合生成视频和音频,阿里确认项目仍在开发中。港股当日涨2.12% 🔗 CNBC | Bloomberg | The Information
💬 匿名→登顶→揭晓→股价涨——HappyHorse的营销策略比它的技术更值得研究
2. AutoGPT《State of AI Video 2026》:14大模型最新排名
截至2026年4月的AI视频模型ELO排名(综合Artificial Analysis、arena.ai、designarena.ai):
- 🥇 Google Veo 3.1 — Elo 1293(美国)
- 🥈 xAI Grok Imagine Video — Elo 1285(美国)
- 🥉 OpenAI Sora 2 Pro — Elo 1272(美国,但消费者应用已关停)
- 4 Kling 3.0 Pro — Elo 1258(中国)
- 5 PixVerse V6 — Elo 1235(中国)
- 6 Vidu Q3 Pro — Elo 1224(中国)
- 7 Runway Gen-4.5 — Elo 1220(美国)
- 8 Seedance 1.5 Pro — Elo 1214(中国)
- 9 Luma Ray 3 — Elo 1203(美国)
- 10 Wan 2.6 — Elo 1197(中国)
- 11 Hailuo 2.3 — Elo 1190(中国)
- 12 LTX-2 Pro — Elo 1103(以色列)
- 13 Pika 2.5 — Elo 1089(美国)
- 14 HunyuanVideo 1.5 — Elo 1053(中国) 🔗 AutoGPT
💬 14个模型7个来自中国,但前三全是美国的——数量优势和质量优势的差距仍然存在
3. Sora正式关停消费者应用:OpenAI的AI视频战略转向
OpenAI 3月24日宣布关停Sora消费者应用,最后使用日期为4月26日。模型仍通过API可用,但标志着OpenAI将AI视频定位为”基础设施”而非”独立产品”。战略重心转向编码工具、企业客户和AGI。Sora的关停为竞争对手让出了市场空间——特别是中国厂商 🔗 CNET | AutoGPT
💬 Sora从”震惊世界”到”悄悄关停”只用了六个月——AI视频的商业化难度远超技术难度
4. ByteDance Seedance 2.0因版权争议暂停推广
CNBC报道,字节跳动因与好莱坞主要制片厂和流媒体平台的版权纠纷,被迫暂停了Seedance 2.0的推广。这与Higgsfield用Seedance 2.0制作Arena Zero形成鲜明对比——技术可用,但版权风险让商业推广变得复杂 🔗 CNBC
💬 Seedance的版权困境是所有AI视频模型的预演:你的训练数据里有别人的电影,你生成的视频像别人的电影,然后你说”这是AI生成的,不侵权”——这个辩护能成立吗?

1. Sora替代格局成型:Veo 3夺最佳付费工具,Kling 3.0成性价比之王
CNET 4月6日更新的AI视频工具评测排名:
- 🏆 最佳付费电影级:Google Veo 3
- 🏆 最佳专业用途:Adobe Firefly
- 🏆 最佳性价比:Kling 3.0
- 🏆 最佳一致性:Runway Gen-4.5
- 🏆 最佳免费工具:Seedance 2.0
HowDoIUseAI的深度评测确认了商业授权范围:Runway Gen-4.5、Kling 3.0、Luma Dream Machine 3(Plus以上)、Google Veo 3.1均支持付费用户商用 🔗 CNET | HowDoIUseAI
💬 Sora退出后的AI视频市场终于有了”官方排名”。但注意:每个工具的”最佳”都是在特定场景下的——没有万能工具
2. LiblibAI整合30+视频模型:一站式工作流成趋势
LibTV集成Seedance 2.0,将30多个AI视频模型整合到一个工作空间。用户不再需要在不同平台之间切换,一个平台内就能选择最适合当前场景的模型。这标志着AI视频工具正从”单模型竞争”走向”生态整合” 🔗 abit.ee
💬 LibTV的模式很像Adobe——不是靠一个最强产品赢,而是靠”什么都有”赢。AI视频的未来属于整合者
3. Seedance 2.0 vs Kling 3.0 实测对比:快还是稳?
Sovra Blog 4月初更新的详细对比:
- 速度:Seedance 2.0(30-40秒) vs Kling 3.0(45-60秒)
- 画质:两者均支持4K输出,Kling在复杂场景更稳
- 音频:两者均支持AI生成音频
- 运镜控制:Seedance更精准,Kling更自然
- 定价:Seedance免费版够用,Kling付费版更便宜 🔗 Sovra | Seedance
💬 结论不变:简单场景用Seedance求快,复杂场景用Kling求稳。聪明创作者两个都用
4. 36氪数据:AI短剧每分钟制作成本60元,但仍没诞生一个爆款
36氪3月底的调查:AI短剧制作成本已降到每分钟60元(对比真人短剧动辄几十万一集),Seedance 2.0进一步压缩了制作周期。但问题在于——便宜不等于好看,低质量AI短剧的完播率远低于真人短剧。“省钱”和”好看”之间还隔着一个”审美判断力” 🔗 36氪
💬 AI短剧的困境:制作门槛降到了谷底,但创意门槛没有。当所有人都能做AI短剧时,做出来好看的仍然是少数
1. Sora关闭后的AI视频格局:三足鼎立
Bloomberg数据显示Sora宣布关闭一周内,Kling AI(快手旗下)、Runway、Vidu三家平台用户量激增。Kling凭借对中文提示词的优秀理解力和相对低廉的价格,成为中国创作者的首选;Runway凭借Gen-4的画质和一致性优势稳居欧美市场;Vidu作为新秀以性价比切入 🔗 Bloomberg
💬 AI视频市场的”三足鼎立”格局正在形成:快手Kling=中国市场、Runway=欧美市场、Vidu=性价比市场。Sora用自己的退出完成了最后一次”市场教育”
2. Seedance 2.0 vs Kling 3.0:速度与质量的较量
实测对比:Seedance 2.0生成速度30-40秒,Kling 3.0需要45-60秒。Seedance在快速迭代和人物一致性方面有优势,Kling在复杂场景和多角色互动方面更强。对创作者来说,不同场景用不同工具的”混合工作流”可能成为主流
💬 不要问”哪个更好”,要问”什么场景用哪个”。Seedance快但简单场景强,Kling慢但复杂场景稳——聪明的创作者两个都用
3. Runway推出1000万美元基金+Builders计划
Runway不满足于做工具,开始投资用自家技术创业的团队。入选的创业公司将获得:免费API额度、技术支持、Runway核心团队指导、以及潜在的后续融资对接。这是AI视频领域首个系统性的创业孵化计划 🔗 TechCrunch
💬 Runway的野心:不只做最好的AI视频工具,要成为AI视频生态的”YC”。从卖铲子到开金矿学校——这个升级很聪明
4. Runway Gen-4持续改进:运动一致性和更长片段
Gen-4的最新更新聚焦两个痛点:①角色运动的帧间一致性(减少”抽搐”和”变形”);②支持更长的连续生成片段。这两个改进直接回应了创作者最频繁的抱怨。对比Sora的关闭,Runway选择了另一条路:不做社交产品,专注做最好的创作工具
💬 Gen-4的改进方向说明Runway很懂创作者:不要花哨的新功能,先把”不抖”和”更长”做好。基础体验大于一切
1. Sora正式宣布关停:4月26日App停服,9月24日API下线
OpenAI在3月28日宣布关闭Sora,给用户28天导出期。Sam Altman解释原因:拒绝开发成瘾功能来维持商业可行性,涉及10亿美元迪士尼版权纠纷。Forbes分析:对OpenAI而言这只是”忙碌新闻周期里的一个小脚注” 🔗 Forbes | CNBC
💬 Sora死得最讽刺的地方:OpenAI一边说”不想做上瘾产品”,一边让ChatGPT每天被2亿人使用。从Sora身上抽回的算力,可能比一个社交App值钱一万倍
2. B站自研”updream”AI视频创作工具开启内测
核心三能力:具备长期记忆的智能助手、个性化”技能库”、开放创作”画布”。正赶上B站AI创作大赛作品井喷期 🔗 新浪财经
💬 从平台到工具,B站走的路径跟YouTube一脉相承:留住创作者比留住观众更重要
3. B站AI创作大赛三体赛道爆发
多部三体同人AI短片集中涌现:《二向箔:引线计划》《去二维》《流浪地球3》AI预告片等。Seedance 2.0成为创作者最爱用的模型之一 🔗 Bilibili
💬 三体+AI=中国创作者的新战场。当你用AI拍出”二向箔”的效果时,你已经不只是在看三体了,你是在参与”面壁计划”
- Google发布Veo 3.1 Lite:最具性价比的视频生成模型——720p起价$0.05/秒(Veo 3.1 Fast的不到一半),同速度,支持文生视频和图生视频,4/6/8秒片段。4月7日起Veo 3.1 Fast全线降价:720p从$0.15降至$0.10,4K从$0.35降至$0.30 🔗 Google Blog
💬 Google的策略很清楚:Sora死了,价格战开始。Veo 3.1 Lite的定价逻辑不是”我值多少”,而是”你的竞争对手已经死了,市场空出来了”
- Seedance 2.0登陆CapCut海外版,字节全球化布局加速——已覆盖巴西、印尼等7国+非洲/南美/中东市场,支持最长15秒片段、6种宽高比。因好莱坞版权投诉暂未进入美国,CapCut会屏蔽真人面部生成和未授权IP 🔗 CapCut官方
💬 字节用Seedance在全球”圈地运动”的速度,比Sora的死亡速度还快。互联网的丛林法则:你倒下的瞬间,别人已经在你的地盘上插旗了
- Runway Gen-4.5发布+$10M Builders基金——3月25日上线Gen-4.5,复杂运动编排和文本到事件序列能力大幅提升。同步推出1000万美元基金投资AI影视生态创业公司,从模型商转型平台商 🔗 TechCrunch
💬 Runway同时做了两件事:发模型+发钱。前者留住创作者,后者锁定开发者。双管齐下构建生态的策略,比单纯追求”最好的模型”聪明十倍
- Kling 3.0继续稳坐免费之王:每天66个免费积分,全球可用——快手Kling在Sora关停后成为最大受益者,人物一致性和手部细节表现最佳,无需信用卡、无需排队 🔗 eWeek
💬 Kling的策略是AI版的”拼多多”——不比谁最好,比谁最便宜。当竞争对手都在收费时,免费就是最大的差异化
- Pika 2.5保持快速迭代,专注社交媒体短视频场景——在Sora关停后的AI视频工具格局中,Pika定位”最快的社交内容生成器”,与Kling的免费策略和Runway的专业路线形成差异化 🔗 VEED
💬 AI视频生成的终局不会是”一个模型通吃”,而是每个模型占据一个生态位:Runway做专业、Kling做免费、Pika做快速、Veo做画质
- OpenAI正式关停Sora:3月25日起停止服务,APP将于4月26日下线,API于9月24日终止——据报道Sora运营成本高达每天1500万美元,总收入仅210万美元。Disney此前撤回的10亿美元合作协议成为最后一根稻草。OpenAI将资源转向机器人和世界模拟方向 🔗 Wikipedia - Sora
💬 日烧1500万美元只赚210万——Sora不是被竞争对手杀死的,是被自己的商业模式杀死的
- Seedance 2.0 成为中国AI视频生成的标杆:月活4500万,支持最多12个多模态输入——字节跳动旗下即梦Seedance 2.0在运动物理和创意灵活性上领先,但基础会员排队10小时的算力瓶颈仍未解决 🔗 SitePoint
💬 Seedance的策略很清楚:先让4500万人上瘾,算力的事以后再说。这个”以后”撑得住吗?
- Kling 3.0 成为性价比之王:每天66个免费积分,无需信用卡——快手旗下的Kling 3.0在人物一致性和手部细节上表现最佳,搭配最低的使用门槛,成为Sora关停后最大受益者 🔗 The AI Journal
💬 每天66个免费额度——Kling用最原始的策略(白嫖)赢得了最多用户
- Google Veo 3.1 引领画质:原生4K升频、Audio同步、多参考模式——新用户$300云端额度、学生12个月免费,Gemini Pro一个月试用。在分辨率和音视频同步上持续领先 🔗 Efficient Coder
💬 Google的套路:技术最好,但要用我的云。Veo 3.1的真正产品不是视频,是GCP的使用量
- Runway Gen-4 Turbo 占领专业市场:视觉叙事管线最完善——在Sora关停后加速抢占专业创作者市场,生成时间比Sora减少60-80%,质量指标持平或超越 🔗 Digital Applied
💬 Runway一直很聪明:不做最好的模型,做最好的工作流。专业创作者要的不是惊艳的demo,是靠谱的工具
- 即梦即将上线OCTO小章鱼专业创作平台:画布管理、团队协作、账号数据同步——定位从个人创作者升级到团队协作,显示字节在AI影视生产工具链上的野心 🔗 Bilibili
💬 字节做AI视频的路线图清晰得可怕:模型→工具→平台→生态。OCTO是第三步