attention seq2seq GPT Magnus 跟 机制 Ekm 旗标 self 预售 学 NVIDIA Transformer 架构 扎稳大型语言 LLM 基础