百川汽车维修配件汽修公司网站建设 - 专业的汽车维修配件汽修公司网站建设

资讯热点
视频“焦虑症”的爆炸?百度的VidPress提供了新的想法

发布时间:2023-5-13 分类: 行业资讯

拥抱短视频可能是最近媒体圈最热门的关键词。

光是微信视频号的灰度测试就在媒体圈引起了剧烈的地震,原本隐藏在文字背后的“中年大叔”们勇敢地出现,试图抓住新生的机会窗口。每天和媒体朋友聊天的话题也不自觉地转向了短视频。有人购买了专业的影像设备,也有人迅速招聘了熟悉视频编辑的助理.

随后,在百度研究院推出AI合成短视频平台Vidpress的消息传出后,媒体圈再次炸开了锅,排队通过百度创意大脑申请测试,力求将他刚刚写好的深度文字转化为丰富多彩的短视频。毕竟Vidpress的“果实”并不诱人,只要输入一个图文内容的链接,就可以自动生成相应的视频内容,大大节省了成本和精力。

一些早期采用者之后,有人给Vidpress打了高分,也有人批评对结果不满意。针对褒贬两种态度,来分享一下我个人对Vidpress的看法。是理想又输给了现实,还是一开始就期望过高?

01智能内容生产的原理

Vidpress解读视频制作模式,可以用“智能”这个词来形容。

用户输入图文内容的链接后,Vidpress将在9分钟内完成视频素材聚合、评论生成、语音合成、音视频齐、渲染导出等一系列“骚操作”,平均每天可制作500至1000个视频,妥妥地秒杀整条街的“剪刀手”。

这种制作内容的方式是否被夸大了?我们来看看“黑魔法”背后的技术原理。

整个内容制作过程可以分为三个环节:

第一步是音频内容的生成。该平台基于多种语言模型对图形内容的文本部分进行处理,然后自动生成符合要求且适合视频呈现的评论,再通过文本到音频服务(TTS)合成评论语音;

同步链接是视频内容的生成。平台会对图文内容进行语义理解,根据文章内容自动搜索相关素材,通过计算机视觉技术对素材进行分析理解,然后选择合适的素材进行智能编辑合成;

最后一个环节是音视频对齐,它涉及到百度第二代时间轴对齐算法,该算法选择文本中的兴趣点,然后对视频剪辑和兴趣点之间的相关性进行评分。高质量的视频剪辑会先放入时间轴,最后渲染输出。

对于熟悉百度技术体系或产品体系的人来说,恐怕不会对Vidpress的存在逻辑感到惊讶。在百度大脑对外开放的技能中,与自然语言理解、语音合成和计算机视觉相关的技能占了很大比例。聚焦产品,在Vidpress中不难发现小度智能音箱的语音问答、动态播报、人脸识别等类似技术。

但短视频内容的制作从来都不是纯粹的技术工作,素材、创意、选题都影响最终的视频质量。Vidpress的价值在于利用算法和模型来降低收集、整理、匹配和编辑素材的时间成本,这与目前大多数应用于地面的人工智能产品类似,尚未达到替代甚至击败人工的智能化程度。

也就是说,现阶段的Vidpress只是辅助人工合成视频,降低了短视频剪辑的门槛和成本,本质上为内容生产提供了新思路。

视频合成中的制约因素

不幸的是,很多媒体朋友在看完新闻后都测试了Vidpress,然后出现了一些负面的过度解读。

为什么视频合成效果不理想?还是要回到视频内容生成的环节。就技术而言,素材的智能识别、匹配和编辑过程没有重大技术瓶颈,但问题在于内容素材的广度。

毕竟现阶段的人工智能还远没有独立生产视频内容。Vidpress还需要搜索和匹配在线内容,扮演内容“搬运工”的角色。对应的场景是:在科技、娱乐、军事等内容素材丰富的领域,Vidpress的表现并不缺乏,也不难看到一些精彩的视频案例;在一些冷门的、新闻素材少的领域,合成视频的效果大打折扣。

举两个简单易懂的例子。

如果上传与娱乐圈和某个明星相关的内容,在网上搜集丰富的素材并不难。毕竟可以找到大量的电影、电视剧、综艺等资源。Vidpress可以基于人脸识别算法和时间轴转齐算法,对素材内容进行准确的识别、匹配和合成。恐怕内容的丰富性和流畅性都不逊色于专业的视频编辑团队。

如果图文内容属于与情感、公益、社会相关的冷门内容,话题本身就比较宽泛,包含了很大比例的敏感内容,可使用的内容素材也相对有限,导致平台可聚合的内容素材数量较少。即使技术和算法进一步优化,也难以逃脱“无米之炊”的窘境。

归根结底,内容素材的丰富性是应用Vidpress场景时的限制因素。

同时,需要考虑的恰恰是我们对内容生产的态度。Vidpress的基本价值在于工具,提供了不同于传统手工的视频合成思路,降低了视频内容制作的难度值。但对于媒体人来说,还是需要打磨内容输出的有价值的想法,然后用Vidpress实现价值最大化。毕竟视频只是传播的载体,高质量的内容永远是话语权的关键。

或许这也是对Vidpress的一种启示。前期试错后,需要调整产品的定位,比如在定制和垂直品类上加大力度,选择合适的场景,尽可能避免材料中小众内容的限制,打造通用解决方案。

03未来可能的产品方向

从百度的立场来看,AI合成短视频平台是在短视频时期推出的,恐怕不是为了展示技术,吸引眼球。

从图文到短视频再到直播,内容传播的方式越来越多样化。然而,随着传播载体的不断演进,内容生产的方式似乎有些过时。从博客时代到微信官方账号时代,从长视频时代到短视频时代,内容的表达越来越个性化,但内容的生产一直是一项“笨拙”的劳动。

内容传播载体的演变创造了一个又一个出口。当内容创作方式同步演进时,可能会改变一个时代,可以创造的想象空间不容小觑。截至目前,Vidpress仍处于小批量免费试用阶段。与百度,内部人士沟通后发现,可能有两个产品方向:工具和平台。

从工具的角度来看,Vidpress大概率会作为SaaS服务存在,可以在智能云、百度,部署运营,也可以私有化。前者可以服务大部分内容创作者,提供在线工具进行快速视频编辑合成,并可以与内容版权方跨界合作,为创作者提供一站式视频内容制作服务;后者是赋予专业内容团队能力,借助人工智能的技术优势,帮助创意团队提高效率、降低成本。

从平台来看,Vidpress将在现有工具属性的基础上,与百家号、好看视频、百度联盟等内容生态对接,形成完整的视频内容生产、分发、变现产业链。只有生态布局的前提是解决内容版权的限制。目前Vidpress只是邀请测试,不涉及商业用途。正式开放后,百度有必要提供免费版权视频库,与一些第三方视频版权库合作,设计一个按需付费的商业模式。

当然,以上所有的可能性都只是猜测,最终的产品演进方向还要看百度的产品经理给出的答案,不过,这类产品的出现对媒体的影响远远大于某个内容平台的崛起。我们不仅要思考下一波流量在哪里,更要深入思考我们的核心竞争力在哪里,如何与人工智能合作,在未来的内容生态中准确找到自己的位置。

几乎可以肯定的是,只消耗脑力和时间的传统内容生产终将被颠覆,但这也是Vidpress二三代产品的使命,现阶段还有些不成熟。

04写在最后

比起被下一个出路抛弃的焦虑,不如多花点时间思考内容消费的内在逻辑:当一个热点出现时,需要对报道进行多维度的观察,需要观众客观地了解事件的始末,这就需要各种不同的声音。输出有价值的信息可以说是内容创作最基本的竞争力,剩下的就是基于成本、效率和用户品味的平衡。

Vidpress正试图降低“说话”的门槛,促进互联网内容的多样性。只是在这个阶段,我们不得不推迟一些预期,等待Vidpress能力的后续输出。

« 洗QQ群淘宝客分裂日赚千元方法 | 企业做网络营销普及的最终目的 »