以色列企业Lightricks已将旗下具备190亿参数的模型LTX-2开放源代码。此系统能够依据文本描述,生成同步的音频与视频内容,并且宣称其速度相较于竞争对手更具优势。
根据技术报告,该模型可根据单一文本提示生成长达20秒的视频,并同步立体声音频。这包括对口型语音、背景音效、拟音效果以及与每个场景匹配的音乐。Lightricks表示,LTX-2的完整版可达到4K分辨率,最高可达50帧每秒。
研究人员指出,当前的视听生成技术存在着基础性的不足。不少系统采用的是分步处理的模式——要么先制作视频再配上音频,要么反过来操作。这类相互分离的处理流程,难以准确把握两种模态之间真实的联合分布规律。比如口型同步虽然主要由音频决定,但声音所处的声学环境又会受到视觉场景的影响。显然,只有构建起统一的模型,才能够妥善应对这种双向的依赖关系。
为什么非对称架构对音视频生成如此重要
LTX-2运行在一个非对称双流变压器上,总参数为190亿。视频流拥有140亿参数——远远超过音频流的50亿个容量。研究人员表示,这种分裂反映了两种模态信息密度的不同。
两条流各自采用不同的变分自编码器处理对应的模态。这种解耦方式为特定模态的位置编码提供了支持:针对视频时空结构的三维旋转位置嵌入(RoPE),以及针对音频纯时间维度的一维嵌入。双向交叉注意力层将这两条流连接起来,能够精准地把视觉事件和对应的声音关联起来,例如物体撞击地面的场景。
在文本理解层面,LTX-2 采用 Gemma3-12B 作为多语言编码器。该系统并非仅对语言模型的最后一层进行查询,而是调用所有解码层并将各层信息加以整合。此外,模型引入了“思考标记”——也就是输入序列里额外设置的占位符,目的是在生成内容前预留出更多空间来处理复杂提示。
速度提升使LTX-2领先于竞争对手
根据基准测试结果,LTX-2在推理速度方面展现出明显的优势。在Nvidia H100 GPU环境下,该型号完成每一步需要1.22秒,可处理121帧、720p分辨率的内容。而同类的Wan2.2-14B仅能生成无音频的视频,且耗时长达22.30秒。经Lightricks统计,LTX-2的速度由此达到了Wan2.2-14B的18倍。
其最大视频时长为20秒,这一数据超越了竞争对手:谷歌的Veo 3最长可达12秒,OpenAI的Sora 2为16秒,而Character.AI的开源模型Ovi仅能达到10秒。在针对人类偏好的研究中,LTX-2的表现“显著优于”Ovi等开源替代模型,并且取得了与Veo 3、Sora 2等专有模型不相上下的效果。
不过,研究人员也承认存在若干局限性。质量因语言而异——语音合成对于代表性不足的语言或方言来说可能不那么精确。在多说话场景中,模型偶尔会将语音内容分配给错误的角色。超过20秒的序列可能会出现时间漂移和同步下降的问题。
开源发布挑战,封闭式API方法
Lightricks对开源该模型的决定给出的解释,是对当下市场状况的一种批判。其创始人Zeev Farbman在发布视频里表示:“我实在无法理解封闭API要如何做到这一点,毕竟他们还在谈论当前视频生成模式所具备的潜力。”如今行业存在这样一个困境:一方面,人们能够产出令人惊叹的成果;但另一方面,这些成果在控制精度上又远远满足不了专业人士的需求。
公司同样明确表明其道德立场。“人工智能能够提升人类的创造力与智能水平。但我所担忧的是,他人可能会掌控属于我的增强能力,”法布曼接着阐述。其目标在于依托自身硬件、遵循自身原则来运行人工智能,并且联合广大创作者群体共同制定伦理决策,而非将这些决策外包给那些有自身利益考量的少数群体。
这个版本除了模型权重外,还包含精简版本、多款LoRA适配器,以及能够支持多GPU的模块化训练框架。该模型针对英伟达的RTX生态系统做了优化,可在RTX 5090这类消费级GPU和企业级系统上运行。模型权重与代码可以在GitHub和Hugging Face平台上获取,在公司内部平台免费注册后还能查看演示。
2026年1月8日至11日,备受行业关注的「阿里云通义智能硬件展」于深圳·海上世界文化艺术中心盛大开幕,吸引了国内外众多前沿科技品牌及创新智能产品参展。 作为AI智能硬件领域的创新力量,酷赛智能携最新AI智能硬件产品亮相,全方位展示技术落地成果,并带来专业产品技术演讲,深度分享在AI应用领域的最新进展,为现场观众呈现一场科技与情感交融的智能盛宴。 一、技术分享:解锁AI陪伴的情感新境界 展会期间,酷赛智能AI硬件事业部总经理孙晓灵先生受邀发表主题演讲,演讲题目为《酷赛情绪感知、智能陪伴技术》。他在演讲中聚焦酷赛智能在人工智能技术领域的突破,系统阐述了情绪感知智能陪伴技术如何完成从“功能陪伴”到“情感陪伴”的跨越式升级。 演讲中指出,情绪感知智能陪伴技术以多模态情感计算与深度神经网络为核心架构支撑,助力AI实现从“解读语言”到“感知情感”的跨越。这项技术构建了“多维度情绪数据采集、情绪状态精准建模、智能安抚策略生成”的全流程技术闭环,同时对儿童的行为、语音、表情等多方面数据进行识别与剖析,从而精准对接学习压力缓解、社交矛盾调和、负面情绪慰藉等儿童成长关键场景,使AI陪伴能够切实契合儿童身心发展的实际需求。 据介绍,这项技术的核心优势主要体现在四个方面:首先,它针对3到15岁儿童的生理与心理特征进行了专项优化,能够实现精准的情绪识别;其次,融合了语音、文本、表情等多维度的感知数据,让情绪判断更加全面和立体;第三,构建了符合儿童身心发展规律的个性化安抚策略,从而实现科学有效的情绪疏导;最后,它同时具备即时安抚和长期情绪管理能力培养的双重价值,为儿童的心理健康成长提供支持。 这项技术已在酷赛智能AI桌面机器人等系列产品中实现落地应用,它既能精准家长育儿时面临的“情绪识别难、疏导方法少”这一核心难题,还将打造儿童情绪管理的科技新范式,借助科技之力为儿童的心灵成长提供坚实保障。 二、成果展示:酷赛智能AI应用生态惊艳全场 在酷赛智能的特色展示区,基于情绪感知智能陪伴技术开发的AI桌面机器人、AI NAS相册等核心产品精彩亮相。这些产品凭借创新的功能设计和温暖的情感交互体验,吸引了众多参会嘉宾驻足观看、咨询交流,成为展会的热门打卡点之一。 其中,AI桌面机器人堪称“儿童情感陪伴小管家”。它的面部配备了高清显示屏,能够生动呈现自然流畅的表情与交互界面,再加上超过800种行为表现模式以及长期记忆功能,能让孩子体会到持续且稳定的陪伴,从而建立起情感上的联结。 在交互层面,机器人融合语音、视觉、触摸多模态感知技术,让反馈更精准、响应更自然,真正实现“懂情绪、会交流”的智能互动。 另一款重磅产品AI NAS相册,以“全家人的智能影像管家”为核心定位,精准解决传统电子相框的诸多痛点。产品采用金属质感超薄机身设计,支持横竖多角度灵活摆放,兼具颜值与实用性。功能上,其具备NAS存储、本地数据保障、有线无线双传输、双重空间划分、一键智能语音搜索等核心优势,更依托酷赛自研AI智能分类系统,可高效完成照片梳理,自动清理重复、模糊影像。 尤为亮眼的是,它能从用户上万张照片中智能精选精彩瞬间,自动生成带有背景音乐与转场效果的“成长记忆”或“旅行纪念册”,让沉睡的家庭影像记忆真正“活”起来,成为承载家庭情感、连接亲情的重要载体。 此次亮相阿里云通义智能硬件展,是酷赛智能在AI应用领域技术实力与应用成果的一次集中展示。 未来,酷赛智能将不断优化产品体验,推动情绪感知技术在更多家庭场景、教育场景的落地应用。同时,酷赛智能将积极携手行业生态伙伴,探索AI智能硬件的创新可能,让人工智能陪伴更懂人心、更有温度。;
1月12日消息,荣耀手机今日对外宣布,荣耀Magic8 RSR保时捷设计新品将于1月19日正式发布。 荣耀方面称,荣耀Magic8RSR保时捷设计延续了经典的保时捷流光飞线设计风格,实现了艺术设计与功能美学的精妙融合。 与此同时,数码博主“数码闲聊站”也透露了这款新机的核心配置详情,新机将采用第五代骁龙8至尊版芯片,其顶配机型还将配备24GB+1TB的存储组合。 荣耀Magic8 RSR保时捷设计的正面搭载了一块6.71英寸的1.5K LTPO等深四曲屏,其分辨率达到2808×1256。 影像配置上,这款新机型的后置镜头组合包含5000万像素超大底主摄、5000万像素超广角镜头,以及一枚2亿像素大底潜望式长焦镜头。其中长焦镜头的光圈规格为f/2.6,可实现3.7倍光学变焦功能,并且主摄与长焦镜头都配备了OIS光学防抖技术。 在其他配置方面,荣耀Magic8RSR保时捷设计搭载了7200mAh的大容量电池,不仅支持120W有线超级快充,还配备80W无线快充功能;同时拥有3D人脸识别与3D超声波指纹识别双重生物识别方案,并且达到了IP68、IP69以及IP69K的顶级防尘防水等级,此外该机型还支持天通卫星通信技术。 ;
随着人工智能行业的迅猛发展,内存与固态硬盘的价格目前已攀升至历史峰值。据预测,这种供应短缺的局面将延续至今年之后,给预算紧张的电脑用户带来不小的困扰。但从当前形势来看,情况或许还会变得更加严峻。 据最新消息,继内存与固态硬盘之后,电源和CPU散热器的价格也即将迎来上涨,预计这两类产品的涨幅大概在6%到10%左右。 广州鑫鸿正电子科技有限公司发出警告表示,鉴于铜、银等上游原材料成本上升,供应商已不再接受按原有价格下的订单。 信中提到,电源价格会有6%到10%的涨幅,CPU散热器价格的涨幅大约在6%至8%之间。该公司已经催促合作伙伴尽快下单,从而规避价格上涨带来的风险。 另外,自2月1日开始,所有促销活动都将停止,所有商品都将按照新的定价进行销售,这就表示消费者如今需要为电源和CPU散热器支付更高的费用了。 总而言之,当下堪称PC游戏玩家面临的最艰难阶段,市场各方面的状况都可能持续恶化。仅仅几个月前,花费1000美元还能轻松组装出一台性能尚可的游戏PC,可如今要做到这点会困难不少。 ;
1月12日消息,Intel于CES展会期间正式对外宣布,旗下Panther Lake系列将推出掌机专属版本芯片。据爆料者Kepler_L2透露,这款采用18A工艺打造的掌机专用芯片,在性能表现上有望与索尼下一代代号为“Canis”的PS6掌机相媲美。 此前,Intel的Meteor Lake与Lunar Lake虽已涉足掌机领域,却未能在性能与功耗方面同AMD的“Z”系列SoC相竞争。 此次Panther Lake掌机芯片计划大幅精简非必要功能,保留更多Xe3核心以及充足的CPU核心,甚至有可能彻底取消NPU,以此来最大限度发挥芯片的整体性能潜力。 与此同时,AMD于今年推出的Gorgon Point“锐龙AI 400”系列并未带来显著更新,这表明AMD的掌机SoC在明年之前或许不会有太大变动。 Kepler_L2提到,Panther Lake掌机芯片在30W功耗状态下的性能水平,能够和PS6掌机处于15W功耗时的性能表现相当。尽管二者在能效比方面还存在一定差距,但PS具备自研操作系统的高度优化能力以及游戏厂商的深度适配支持。 首批搭载Panther Lake芯片的PC掌机预计会在2026年中期推出,索尼的“Canis”则计划于2027年启动量产,最快将在2027年底或2028年与PS6主机一同发布。 ;
在《仁王3》的妖怪设定里,蛇骨婆是一位外形像老妪、能同时操控冰火两条蛇的厉害妖怪。她是与人类有深仇大恨的蛇妖的妻子,右手的青蛇掌控着寒冰之力,左手的赤蛇则驾驭着火焰之力,两条蛇就像她忠诚的手臂一样。 仁王3蛇骨婆妖怪介绍 外形特征:外貌看起来像一位老妇人。 核心能力:可驱使两条巨蛇作为武器与伙伴,它们对她极为忠实,宛如左右手般听从差遣。 右手的青蛇掌控着寒冰之力,左手的赤蛇则驾驭着火焰的力量。 背景动机:传闻她是曾被人类封印的蛇族首领“蛇五右卫门”的妻子,故而对人类抱有极深的怨恨。 推荐攻略:见越入道妖怪介绍 查看仁王3攻略大全;