目录

第七周

学习时间

5月24日 到 6月30日

学习目标

  • 注意力机制
    • 注意力提示
    • Nadaraya-Watson 核回归
    • 注意力评分函数
    • Bahdanau 注意力
    • multihead-attention
    • transformer

学习内容

学习总结

所谓注意力机制,其实就是加权平均–将值通过查询和键进行加权平均。 本周学习内容较少,主要是个人事务耽搁了,不过从下周一也就是7月1日开始我将到学校进行全身心的学习和生活。

下周计划

  • 3 paper reviews
  • attention mechanisms