可灵AI基础模型「双子星」重磅更新!快手盖坤:让每个人都能用AI讲出好故
4月15日,可灵AI在北京中关村国际创新中心举行“灵感成真”2.0模型发布会,宣布基座模型再次升级,面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型。
数据显示,自去年6月发布以来,可灵AI已累计完成超20次迭代,截至目前,全球用户规模突破2200万。来自世界各地的超1.5万开发者和企业客户,将可灵的API应用于不同的行业场景中。
一直以来,可灵AI致力于提升模型基础质量,增强画质清晰度,并引入更多创新功能,以满足用户多样化需求。快手高级副总裁、社区科学线负责人盖坤表示,可灵希望让每个人都能用AI讲出好故事,实现更加精准的复杂创意表达。
可灵AI全系模型进入2.0时代,定义人和AI交互的全新方式
4月15日,可灵大模型2.0版本及可图大模型2.0版本正式面向全球发布。据悉,可灵2.0模型在动态质量、语义响应、画面美学等维度,保持全球领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。
盖坤介绍,两款模型在团队内部的多项胜负率评测中,均稳居业内第一。例如在文生视频领域,可灵2.0对比谷歌Veo2的胜负比为205%,对比Sora的胜负比达367%,在文字相关性、画面质量、动态质量等维度上显著超越对手。
自去年6月发布以来,可灵AI已累计完成超20次迭代。3月27日,全球知名AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro以1000分的Arena ELO基准测试评分登陆图生视频(Image to Video)赛道榜首。
盖坤认为,AI在辅助创意表达上拥有巨大潜力,但当前的行业发展现状还远远无法满足用户需求,在AI生成内容的稳定性、以及用户复杂创意的精确传达上仍有“很多挑战”。也因此,要真正实现“用AI讲好每一个故事”的愿景,必须对基模型能力进行全方位提升,定义人和AI交互的“全新语言”。
一直以来,可灵AI致力于提升模型基础质量和模型效果,并引入更多创新功能,以满足用户的多样化需求。在本次2.0模型的迭代中,可灵AI正式发布AI视频生成的全新交互理念Multi-modal Visual Language,让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,直接高效地传达给AI。
“大家应该很自然地会感受到文字在表达影像信息时,是不完备的。我们需要有新的方式,能让人真正精准地表达出心中所想。”盖坤指出,MVL由TXT和MMW(Multi-modal-document as a Word,多模态描述子)组成,能从视频生成设定的基础方向以及精细控制这两个层面,精准实现AI创作者们的创意表达。
可灵2.0大师版正式发布,全新上线多模态视频编辑功能
基于MVL这一全新交互方式,发布会现场,快手副总裁、可灵AI负责人张迪发布了全新的可灵2.0大师版,在语义响应、动态质量、画面美学等方面显著提升生成效果。
“可灵2.0大师版不仅仅是一次简单的技术升级,更是一次全方位的体验跃升。”张迪介绍,可灵2.0大师版实现了技术、体验、美学的三重突破。
在图像生成大模型领域,快手的可图2.0处于行业领先水平,拥有多项核心优势,诸如强大的复杂语义理解能力、电影级的画面质感、多条件的可控风格化生成等。在团队内部的多项胜负率评测中,相较于Midjourney V7、FLUX1.1 pro以及Reve等行业领先的图像模型,均保持明显优势。
张迪介绍,可图2.0文生图能力迎来全面升级。包括大幅提升指令遵循能力、显著增强电影美学表现力以及更多元的艺术风格。在风格化响应上,可图2.0可支持60多种风格化的效果转绘,模型出图创意和想象力实现大幅跃升。
AIGC技术迅猛发展,为全行业发展注入全新活力
除了C端订阅用户,可灵AI也面向B端商家提供API接入等服务。目前,可灵AI已与包括小米、亚马逊云科技、阿里云、Freepik、蓝色光标等在内的数千家国内外企业客户建立了合作关系。
盖坤披露,来自世界各地的超1.5万开发者,已将可灵的API应用于不同的行业场景中,累计生成的图像数量约1200万个,生成的视频素材超过4000万个。
如今,可灵正在成为AI时代视频创作的新基础设施。AIGC技术的迅猛发展,也正在重构包括广告营销、专业创作、影视、娱乐创意等在内的多个行业。
以二次元AI创作社区产品狸谱为例,其产品负责人一休介绍,可灵AI为狸谱带来了创新突破。其1.6版本在人物运动流畅度、镜头移动等方面展现出卓越性能,助力狸谱成功接入“动态LIVE”和“新春萌偶摇”两大功能。前者实现“图 - 影 - 音”快速创作,后者在春节期间引发60万用户转播。未来,双方将基于狸谱的优质内容数据与可灵的算法能力,打造动画模型,推动AI成为内容引擎,并共同孵化优质创作者,构建更活跃的创作生态,携手开启二次元内容产业的新篇章。
“可灵AI可全面融入剧集级创作流程”。可灵AI超级创作者、《新世界加载中》总导演、异类Outliers创始人陈翔宇在分享中介绍,AIGC相较于实拍和动画,不仅是效率的提升,更是试错空间的革命性释放。
从剧本创作到内容发行,异类Outliers团队完成了一次完整的影像工业化创作流程,覆盖从美学表达到镜头结构,再到复杂动作场景与细节的全面呈现。“我们实践之后发现,可灵AI是一个能够稳定、大规模嵌入剧集创作流程的生成式协作大模型。”陈翔宇认为,在AI的辅助下,导演及编剧团队的大量内容创意也实现了更富有想象力的表达,“AIGC也许是下一代内容结构的雏形”。
为了进一步激发AI爱好者们的创作热情,快手副总裁、可灵AI负责人张迪还在发布会现场正式发起“可灵AI NextGen 新影像创投计划”。该计划将加大对于AIGC创作者的扶持力度,通过千万资金投入、全球宣发、IP打造和保障,以全资出品、联合出品和技术支持等灵活多样的合作方式,让AI好故事走向世界。同时,可灵AI面向全球创作者发出征集邀约,邀请用户共同打造全球首支用户共创AI创意短片,让创作者的灵感和创意登陆上海、香港、东京、巴黎、多伦多等世界多地广告大屏。
面向未来,盖坤表示,可灵AI将持续大力推动技术创新,用人与AI交互的全新语言,帮助用户实现复杂创意的精确表达,“我们的初心,是让每个人都能用AI讲出好的故事,我们也真切地希望这一天更快到来”。
声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。
我来说两句
推荐阅读
-
中国银行:下半年我国经济或快速复苏,全年增长4%左右图片来源:人民视觉中国银行研究院周二发布《2022年三季度经济金融展望报告》称,下半年我国宏观经济或将进入快速复苏通道,...
-
上财:今年中国经济或增长4.3%,需高度关注青年就业2017年10月25日,西安,长安大学校园内,学生们在秋雨中现场求职。图片来源:人民视觉上海财经大学高等研究院本周发布报...
-
央行报告:2021年企业贷款利率创新低,东北降幅最大2022年6月13日,辽宁沈阳,工人在水发航宇星物联科技(辽宁)有限公司生产线上制造安全控制型膜式燃气表。图片来源:人民...
-
一个月股价大涨近50%,东瑞股份加大押注“猪周期”,定增图片来源:图虫创意7月8日(周五),东瑞股份(001201.SZ)股价收于44.90元,涨7.78%,自5月30日以来其...
-
太阳能行业周报:产业链价格齐涨硅料涨势将延续多晶硅价格硅业分会和PV-InfoLink数据显示,本周全国单晶致密材料成交均价为28.96万元/吨,较前一周上涨1.9...
-
种业专家创新大讲堂在京成功举办7月9-10日,由中国农业科学院主办,人力资源和社会保障部、农业农村部联合主办的专家创新大讲堂在北京举行。本次大讲堂以“...
-
“20恒大01”本息兑付再展期议案未获债券持有人投票通过7月11日上午,恒大地产发布公告称,《关于调整“20恒大01”债券本息兑付安排的议案》未获债券持有人大会通过。恒大地产表...
-
城市圈乘车码互通刷码乘地铁哪家强?2017年起,公交码成为公交、地铁的标配。深圳地铁依然“孤傲”地实现北上广深的互通。三年前,上海地铁MetroMetro...
-
乘联会6月新能源汽车销量榜:比亚迪、特斯拉、五菱前三,问2022年6月全国乘用车市场分析报告显示,2022年6月新能源乘用车批发销量达到57.1万辆,同比增长141.4%,环比...
-
Minisforum介绍新款UM560迷你主机,支持US今年6月,Minisforum发布了新款UM560miniPC,搭载AMD6核R55625U处理器,支持USB-C一线连...
作者信息