自主研发系统可翻译108种语言,双语平行语料库怎么用

【自主研发系统可翻译108种语言,双语平行语料库怎么用】模型大致结构可见上图,结构很简单,就是两个语言L1,L2共享一个encoder,用这个encoder把L1语言的某句话L1_sent编码成向量vector1,然后在用L2的decoder根据vector1生成L2_sent,此时我们是不是有一个伪平行语料了?是不是感觉事情有了一点点转机?此时是不能直接用这个训练的,得用L2encoder---L2sent编码成vector2,然后强制vector2用L1decoder生成最初始的句子L1_sent,此时

    推荐阅读