深度学习-一文看尽深度学习中的20种卷积
本文字数: 19k 阅读时长 ≈ 47 分钟
学习报告:用于动态人体新视图合成的结构潜码的隐式神经表示
本篇学习报告基于2021 CVPR的人体自由视角合成的论文:《Neural Body: Implicit Neural Representations with Structured Latent Codes for Novel View Synthesis of Dynamic Humans》,该论文由浙江大学CAD&CG国家重点实验室/浙大三维视觉实验室提出。
深度学习-万字长文带你入门Transformer
本文字数: 14k 阅读时长 ≈ 35 分钟
导读
Transformer在许多的人工智能领域,如自然语言处理(Natural Language Processing, NLP)、计算机视觉(Computer Vision, CV)和语音处理(Speech Processing, SP)取得了巨大的成功。因此,自然而然的也吸引了许多工业界和学术界的研究人员的兴趣。到目前为止,已经提出了大量基于Transformer的相关工作和综述。本文基于邱锡鹏[1]老师团队近日所发表的一篇综述[2]为基础,详细的解读Transformer的来龙去脉,同时为大家介绍近期一些相关工作,中间也会穿插一些笔者的见解。最后,本文也将列出一些可探索的未来研究方向,希望能给予读者一些启发。
深度学习-一文看尽深度学习中的各种注意力机制
本文字数: 20k 阅读时长 ≈ 49 分钟
深度学习-万字长文带你入门计算机视觉!
本文字数: 21k 阅读时长 ≈ 52 分钟
跟李沐学AI-动手学深度学习 PyTorch版-33 单机多卡并行
跟李沐学AI-动手学深度学习 PyTorch版-32 深度学习硬件:TPU和其他
学习报告:基于简单循环单元网络和集成学习的脑电情感识别
本篇学习报告基于论文《EEG-based emotion recognition using simple recurrent units network and ensemble learning》,本论文的主要创新点有三点:(1)为了掌握脑电的时间信息,采用了简单循环单元(SRU)网络;(2)模型训练前,采用双树复小波变换(DT-CWT)将原始脑电信号分解为5个子带,利用时间、频率和非线性分析提取特征。然后利用5个频段的4种不同特征建立深度SRU模型。(3)采用三种集成策略对基本SRU模型进行集成,以获得更理想的分类性能。