您的位置:首页 >> 行业研究 >> 文章正文

传媒行业点评报告:Pika、Gemini多模态AI不断突破,AI应用或加速

加入日期:2023-12-8 10:09:24

  顶尖财经网(www.58188.com)2023-12-8 10:09:24讯:

(以下内容从开源证券《传媒行业点评报告:Pika、Gemini多模态AI不断突破,AI应用或加速》研报附件原文摘录)
Pika 1.0 AI 视频生成能力领先, 或引领 AI 视频热潮, 持续利好 IP 开发领域
11 月 29 日,美国 AI 初创公司 Pika labs 发布了 Pika 1.0, 这款产品能够生成和编辑 3D 动画、动漫、卡通和电影,且制作视频门槛较低, 用户只需要输入一句话,就可以生成想要的各种风格的视频,并通过简单的描述,更改视频中的形象和风格。 目前 Pika 1.0 的功能包括: 文本生成视频、图像生成视频、 视频风格转换、对视频内容进行编辑。 在文生视频方面, Pika 动画生成的清晰和连贯性强,且具有优秀的语义理解能力, 可以直接输入文字来生成不同内容和不同风格的 AI 视频。 除了图生视频, Pika 还支持视频生成视频,同时可以直接修改视频中的局部内容以及视频尺寸。 我们认为, Pika 1.0 的推出是 AI 视频生成产品的一次重大升级, 或大幅提高 AI 视频生产效率, 正式开放后有望引领 AI 视频热潮, 同时推动音乐、动画、影视等 IP 开发大幅降本增效,打开收入增量空间。
谷歌发布 Gemini,多模态能力或超 GPT-4, 有望进一步拓展应用场景
12 月 7 日, 谷歌发布了 AI 大模型 Gemini, 作为多模态大模型, Gemini 可以同时识别和理解文本、图像、音频、视频和代码五种信息,且对信息的理解非常精准。 Gemini 包含三个版本:适用于高度复杂任务的 Gemini Ultra、适用于各种任务的最佳模型 Gemini Pro 以及适用于端侧设备的 Gemini Nano。 Gemini Ultra 是首个在 MMLU 任务上表现优于人类专家的大模型,取得 90.0%的成绩。作为对比,人类专家的成绩为 89.8%, GPT-4 为 86.4%。 从测评数据上来看, Gemini的性能在多模态任务上全面超越 GPT-4V,或进一步拓展多模态大模型的应用场景。 此前, OpenAI 于 11 月份发布了 GPT-4 Turbo 且开放了 GPTs,谷歌紧随其后发布了 Gemini, 海外科技巨头之间多模态大模型的竞争日益激烈,同时驱动着底层多模态大模型的能力不断突破, 叠加 GPTs 等 AI 应用形式的出现, AI 应用有望迎来快速增长期。
AI 应用或加速落地并开启商业化, 加码布局 AI 应用
我们认为, 以 Pika 1.0 和 Gemini 为代表的 AI 多模态模型不断突破, 或推动大模型在工具、教育、办公、电商、营销等领域的应用加快落地并打开商业化空间。建议继续布局 AI 应用的两个方向: 一是已推出产品并开启商业化的 AI 应用领域:工具、教育、音乐、校对、营销等; 二是将受益于 AI 视频生成等 AI 多模态模型的游戏、影视等 IP 开发领域。(1)“AI+工具” 受益标的为昆仑万维。(2)“AI+教育” 受益标的为世纪天鸿。(3)“AI+音乐” 重点推荐盛天网络。(4)“AI+校对/动画” 受益标的为果麦文化。(5)“AI+游戏” 受益标的为掌趣科技。(6)“AI+营销/虚拟人” 受益标的包括蓝色光标因赛集团元隆雅图引力传媒等。(7)“AI+IP/影视/视频” 受益标的包括上海电影奥飞娱乐中文在线华策影视捷成股份万兴科技、易点天下等。
风险提示: 多模态大模型技术发展不及预期; AI 应用商业化进展不及预期。





编辑: 来源: