电话咨询

电话咨询:010-62607600

微信咨询

微信扫码

【CVPR2022】MPViT :用于密集预测的多路径视觉变换器
在这项工作中,作者以不同于现有Transformer的视角,探索多尺度path embedding与multi-path结构,提出了Multi-path Vision Transformer(MPViT)。
行业资讯 发布时间:2022-03-11 18:13:39 作者:深延科技
分享 | M4C多模态transformer对TextVQA进行迭代式答案预测
在这项工作中,我们为TextVQA任务提出了一个新的模型,该模型基于一个多模态transformer架构,并伴随着图像中文本的丰富表示。
行业资讯 发布时间:2022-03-10 18:42:41 作者:深延科技
联邦学习 | Non-IID数据 论文:测量联邦视觉分类中不相同数据分布的影响
该论文是麻省理工学院MIT的人工智能实验室CSAIL和谷歌研究院的成果,在图像分类任务中,对FL的非独立同分布数据的影响做了比较细致的实验。
行业资讯 发布时间:2022-03-09 18:22:58 作者:深延科技
【论文笔记】VAN,干掉了CNN和ViT的最新架构
在本文中,提出了一种新的大核注意力large kernal attention(LKA)模型, LKA吸收了卷积和自我注意的优点,包括局部结构信息、长程依赖性和适应性。
行业资讯 发布时间:2022-03-09 18:17:56 作者:深延科技
分享 | 实时风格转换和超分辨率的感知损失
实时风格转换和超分辨率的感知损失。
行业资讯 发布时间:2022-03-07 17:51:37 作者:深延科技

立即使用深延AI平台