/imgs/avatar.png

第六周

学习时间 5月17日 到 6月24日 学习目标 继续学习RNN相关章节 学习 $\LaTeX$ 的使用 了解模型微调/双目视觉的基础理论 学习内容 RNN模型 GRU LSTM deep RNN 双向循环网

束搜索

束搜索是权衡贪心和穷举的一种搜索方式 贪心搜索 贪心搜索的方式是每一个时间步都选择概率最大的那一个token,这样其实并不一定能找到最优解,因为

seq2seq

架构 编码器是一个RNN,读取输入句子 ,可以是双向RNN 解码器使用另一个RNN来输出 训练过程 将输入按照顺序输入给编码器 将编码器的最后一个时刻、

编码器-解码器

引入 实际上是对网络模型的进一步抽象,编码器即是把输入进行特征提取,解码器就是将特征进一步输出。 对于机器翻译任务:第一个组件是一个编码器(en

门控单元GRU

门控单元的核心思想是控制隐状态的生成和传递 重置门和更新门 可以看出,$R_t$ 和 $Z_t$ 是完全相同的,它们有各自的参数,决定它们不同的是后续的操作。