- 多模态大模型:算法、应用与微调
- 刘兆峰
- 240字
- 2024-09-11 17:37:21
1.1 Seq2Seq结构
序列到序列(Sequence to Sequence,Seq2Seq)结构的模型是一种自然语言处理领域中常见的深度学习模型,该结构的输入是一系列类型相同的元素(如字母、单词、图像特征或视频帧),输出是另一系列类型相同的元素,如图1-1所示。Seq2Seq结构的输出元素的类型与输入元素的类型可以相同也可以不同,即具有多模态的潜力。
![](https://epubservercos.yuewen.com/0E5F9C/30516230407062906/epubprivate/OEBPS/Images/0013-01.jpg?sign=1739130822-WfkGb8gre1il5pNcVILH01cn8B5X6l4Z-0-6d34cc486a95fe2ec630664427a6f747)
图1-1 Seq2Seq结构模型示意
Seq2Seq结构的模型非常简洁高效,这种设计使其具有广阔的运用空间,无论在机器翻译、文本摘要还是在语言模型等热门任务中,都取得了显著的成功。所以,本节我们将首先详细介绍这种结构的模型及其工作原理。