(相关资料图)
来源:LiveVideoStackCon 2023主讲人:宋利内容整理:冯冬辉最近 AIGC 技术备受关注,该技术实现了从文本模态到图像模态的高效转换,能够利用文本提示词生成出专业水准的图像或视频。这一技术的商业落地正在逐渐改变着我们的内容生产和消费方式。与此同时,学术界和行业界的前沿正在积极探索多模态大模型,甚至将其推进到了十二种模态之间的对齐与生成。在最近举办的 LiveVideoStackCon 2023(上海,7月28-29日)大会上,上海交通大学的宋利老师发表了一场关于多模态媒体大模型的全景与展望的精彩演讲。他详细探讨了这一系列技术将会如何改变我们的多媒体链条,包括生成、编码和交互方面的进展、前景和挑战。这场演讲向我们展示了多媒体领域一个令人激动的未来方向。
目录
多模态媒体大模型概览
01. 多模态媒体生成
02. 多模态媒体编码
03. 多模态媒体交互
Copyright @ 2015-2022 快报网版权所有 备案号: 豫ICP备20009784号-11 联系邮箱:85 18 07 48 3@qq.com