很多时候图像里有多个我们感兴趣的目标,我们不仅想知道它们的类别,还想得到它们在图像中的具体位置。 在计算机视觉里,我们将这类任务称为目标检测(
微调是迁移学习的一种方式,重新训练已经训练好的模型,在训练时固定原模型的某些层,降低训练成本,提升针对新数据集的表达能力。一般来说使用微调都
学习时间 7月22日 到 7月28日 学习目标 d2l计算机视觉 双目视觉论文 学习内容 使用WSL进行python开发 WSL配置深度学习环境 图像增强 survey-on-depth-estimation/ 学习
常用的图像增广方法 翻转和裁剪 torchvision.transforms.RandomHorizontalFlip() torchvision.transforms.RandomVerticalFlip() shape_aug = torchvision.transforms.RandomResizedCrop( (200, 200), scale=(0.1, 1), ratio=(0.5, 2)) 改变颜色 color_aug = torchvision.transforms.ColorJitter( brightness=0.5, contrast=0.5, saturation=0.5, hue=0.5) 可以调节 :图像的亮度(brightness)、对比度(contras
在正式配置之前,不要忘了在win11上下载 Geforce EXperience,然后更新最新的驱动。 https://www.nvidia.com/en-us/geforce/geforce-experience/ 安装cuda toolkit安装 wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-wsl-ubuntu.pin sudo mv cuda-wsl-ubuntu.pin /etc/apt/preferences.d/cuda-repository-pin-600 wget https://developer.download.nvidia.com/compute/cuda/12.5.1/local_installers/cuda-repo-wsl-ubuntu-12-5-local_12.5.1-1_amd64.deb sudo dpkg -i
众所周知,windows的shell非常不好用,很多linux好用的命令都不能用, 在学术领域,绝大多数的实验都是在linux环境跑的,也就是
问题现象 git push 我的博客的时候,出现如下提示 fatal: protocol error: bad line length 189 send-pack: unexpected disconnect while reading sideband packet error: failed to push some refs to 'https://github.com/pmzzzz/myWebsite.git' Enumerating objects: 32, done. Counting objects: 100% (32/32), done. Delta compression using up to 8 threads Compressing objects: 100% (24/24), done. 问题原因 我记得
学习时间 7月15日 到 7月21日 学习目标 d2l注意力机制 学习内容 bahdanau 多头注意力 子注意力与位置编码 Transformer 学习总结 本周恢复了学习的脚步,将d2l的注意力
模型 Transformer作为编码器-解码器架构的一个实例 Transformer是由编码器和解码器组成的。Transformer的编码器和解
**自注意力 给定一个由词元组成的输入序列 $\mathbf{x}_1, \ldots, \mathbf{x}_n$, 其中任意 $\mathbf{x}_i \in \mathbb{R}^d$($1 \leq i \leq n$)。 该序列的自