自注意力和位置编码

泡面zz 发布于 2024-07-19 收录于学习

**自注意力给定一个由词元组成的输入序列 $\mathbf{x}_1, \ldots, \mathbf{x}_n$，其中任意 $\mathbf{x}_i \in \mathbb{R}^d$（$1 \leq i \leq n$）。该序列的自

多头注意力

泡面zz 发布于 2024-07-18 收录于学习

多头注意力即是在注意力的基础上，用独立学习得到的$h$组不同的线性投影（linear projections）来变换查询、键和值。然后，这$h

Bahdanau 注意力

泡面zz 发布于 2024-07-17 收录于学习

模型这个新的基于注意力的模型与 seq2seq 中的模型相同，只不过eq_seq2seq_s_t中的上下文变量$\mathbf{c}$ 在任何解码时间步$t&

第八周

泡面zz 发布于 2024-07-07 收录于学思感行

学习时间 7月1日到 7月7日学习目标 3 paper reviews attention mechanisms 学习内容 Research-Progress-on-Binocular-Stereo-Vision-Applications paper_review/survey-on-depth-estimation raft-stereo 学习总结本周阅读了一篇中文综述一篇英文综述。对双目视觉，基于深度学习的立体匹配涉及

/posts/learning/paper_review/survey-on-depth-estimation/1.png

A Survey on Deep Learning Techniques for Stereo-based Depth Estimation

泡面zz 发布于 2024-07-03 收录于 Paper Review

范围和分类 SCOPE AND TAXONOMY 本篇论文主要讨论的是基于深度学习的立体深度估计。深度估计的任务是从一张或者多张图片中获取图像的深度信息，这些图片可能来自同一

/posts/learning/paper_review/research-progress-on-binocular-stereo-vision-applications/1.png

双目立体视觉研究进展与应用

泡面zz 发布于 2024-07-01 收录于 Paper Review

引言双目立体视觉利用立体匹配算法对校正后的双目相机左右两幅图像进行密集匹配,建立两幅图像像素点之间的密集对应关系(用视差图表达),再根据相机

/posts/learning/paper_review/raft-stereo/1.png

RAFT-Stereo:Multilevel Recurrent Field Transforms for Stereo Matching

泡面zz 发布于 2024-07-01 收录于 Paper Review

作者 Lahav Lipson 、 ZacharyTeed、Jia Deng 单位 Princeton University 期刊/会议 2021 (3DV) 关键词代码 https://github.com/princeton-vl/RAFT-Stereo

第七周

泡面zz 发布于 2024-06-30 收录于学思感行

学习时间 5月24日到 6月30日学习目标注意力机制注意力提示 Nadaraya-Watson 核回归注意力评分函数 Bahdanau 注意力 multihead-attention transformer 学习内容注意力提示 Nadaraya-Watson 核回归注意力评分函数学习总结

注意力评分函数

泡面zz 发布于 2024-06-27 收录于学习

用数学语言描述，假设有一个查询 $\mathbf{q} \in \mathbb{R}^q$和 $m$个“键－值”对 $(\mathbf{k}_1, \mathbf{v}_1), \ldots, (\mathbf{k}_m, \mathbf{v}_m)$，其中$\mathbf

Nadaraya-Watson 核回归

泡面zz 发布于 2024-06-26 收录于学习

非参数注意力汇聚 Nadaraya 和 Watson 根据输入的位置对输出$y_i$进行加权： $$f(x) = \sum_{i=1}^n \frac{K(x - x_i)}{\sum_{j=1}^n K(x - x_j)} y_i,$$ 其中 $K$ 是核（kernel）。公式所描述的估计器被称为 Nad