您的位置:首页 >> 行业研究 >> 文章正文

传媒行业:海外AI再度加速:多模态模型突破与应用革新

加入日期:2024-2-18 18:47:29

  顶尖财经网(www.58188.com)2024-2-18 18:47:29讯:

(以下内容从信达证券《传媒行业:海外AI再度加速:多模态模型突破与应用革新》研报附件原文摘录)
点评:
OpenAI二月动态汇总:ChatGPT记忆功能测试和视频生成模型Sora发布:2月13日,OpenAI将测试让ChatGPT记住用户对话的新功能,从2月13日起向少数用户开放测试,旨在改善用户交流体验。2月16日,OpenAI发布了首个视频生成模型Sora,能制作长达60秒含复杂背景和情感角色的视频。Sora通过理解物理世界和情感,能根据提示或图像生成视频。Sora利用扩散模型和Transformer架构,从噪声逐步生成清晰视频,可处理不同时间和分辨率的视觉数据。此技术基于DALL·E和GPT的研究,重塑内容创作行业,但仍面临模拟复杂物理和因果关系的挑战。
NVIDIA推出“ChatwithRTX”:2月13日NVIDIA发布“ChatwithRTX”(与RTX聊天)应用程序,ChatwithRTX是一款基于TensorRT-LLM的WindowsPC聊天机器人应用,支持至少8GB显存的RTX30和40系列GPU。它允许用户本地处理多种文件格式和YouTube播放列表转录,无需上网。应用似乎更适用于生成摘要和文档搜索,利用特定数据集生成结果。即将发布的TensorRT-LLMv0.6.0版本将性能提升5倍,并增加对其他大型语言模型的支持。
Google发布全新Gemini1.5,宣布“进入Gemini时代新篇章”:2月8日,Google将其旗下的大语言模型聊天机器人Bard正式更名为Gemini。GeminiUltra旨在与GPT-4竞争,以每月19.99美元的价格向公众开放。2月16日,谷歌宣布推出Gemini1.5。Gemini1.5基于Google的模型开发和基础设施创新,采用新的混合专家架构,提高训练和服务效率。Gemini1.5Pro是一种中型多模态模型,优化了多任务处理能力,并实现了长上下文理解的进步,支持高达128000个token的上下文窗口,特定用户可试用高达100万个token。这使得模型能一次处理大量信息,如1小时视频、11小时音频、超过30,000行代码或超过700,000个单词的代码库。此外,Google对模型进行了优化以改善延迟、减少计算需求,并增强用户体验。
微软开源SliceGPT,成功适用多个大模型:微软和苏黎世联邦理工学院的研究人员联合开源了SliceGPT,该技术可以极限压缩大模型的权重矩阵,将模型体量压缩25%左右,同时保持性能不变。实验数据显示,在保持零样本任务性能的情况下,SliceGPT成功应用于多个大型模型,如LLAMA-270B、OPT66B和Phi-2。
投资建议:
受益于全球生成式AI持续发展,文生图/视频/音乐/代码等多方面应用的迭代更新有望长期给诸多行业带来降本增效,Sora重点受益是IP和视觉内容相关标的:1)AI+IP相关:奥飞娱乐中文在线上海电影果麦文化华策影视捷成股份;2)AI+影视相关:超讯通信因赛集团上海电影(集团支持+IP优势)、华策影视(影视剧储备丰富+微短剧布局)、光线传媒(动画电影受益于文生视频进展)。其他:3)AI大模型端:腾讯、百度、阿里巴巴、昆仑万维科大讯飞等;4)AI+办公:万兴科技福昕软件金山办公;5)AI+游戏:紫天科技(AI游戏先行者,率先发力互动剧)、昆仑万维(新推出AIAgent开发平台,天工大模型六大矩阵看点丰富)、巨人网络(《原始征途》表现优异,休闲品类有望受益新渠道)、掌趣科技(与悠米、行者AI、layabox等合作布局AI+游戏领域)、神州泰岳(游戏出海表现稳健,非游戏板块拥抱AI)、盛天网络(游戏业务稳定基本盘,带带电竞及给麦带来增量贡献)恺英网络三七互娱吉比特宝通科技名臣健康姚记科技顺网科技汤姆猫星辉娱乐等;6)AI+出版:果麦文化南方传媒中南传媒凤凰传媒皖新传媒等;7)AI+教育:世纪天鸿等;8)AI+营销:三人行芒果超媒蓝色光标分众传媒、易点天下、兆讯传媒、浙文互联、遥望科技等。9)美股标的:微软、谷歌、Adobe、Unity等;10)港股标的:腾讯、美图公司、拼多多、阜博集团、柠萌影视、小米集团、小鹏汽车等。
风险因素:生成式AI公司资本开支不及预期、AI应用迭代不及预期。





编辑: 来源: