标签:计算机视觉

IJCAI 2024|首个视频人脸修复技术!让人脸细节更清晰!

极市导读:PGTFormer是首个专门为视频人脸恢复设计的方法,采用端到端的设计,摒弃了传统方法中的复杂对齐步骤,实现了更加高效和连贯的视频人脸恢复。方法介...

ECCV2024|上交推出 PosFormer!优化位置识别任务来辅助表达式识别,复杂公式识别能力再创新SOTA!

本文介绍了上海交大在ECCV 2024上发表的论文PosFormer,这是一种新型的位置森林变换器,用于识别复杂的手写数学表达式。手写数学表达式识别(HMER)是一项将...

面部表情识别相关开源数据集汇总

本文提供了面部表情识别领域的数据集资源汇总,并附有相应的下载链接,旨在帮助计算机视觉和深度学习领域的研究人员和从业者获取所需的数据资源。数据集覆盖...

ECCV24|全局式SfM最新SOTA,GLOMAP重新定义SfM!

本文介绍了一种由ETH和微软共同开发的新型全局结构从运动(Structure-from-Motion,简称SfM)系统——GLOMAP。该系统在全局定位步骤上进行了创新,不同于以往的...

ECCV’24开源 | 塑造SLAM新纪元!6倍加速!LocoTrack:跟踪一切最新SOTA!

在计算机视觉领域,点对应是一个基础性问题,广泛应用于三维重建、自动驾驶和姿态估计等场景。然而,现有方法在处理均匀区域或重复特征时容易遇到匹配歧义的...

目标检测新赛事,70G+真实数据集!ECV2024极市计算机视觉开发者榜单大赛等你来战!

ECV2024极市计算机视觉开发者榜单大赛是一项面向全球开发者的赛事,旨在探索智能视觉技术的深度与广度。大赛于7月25日10:00开赛,报名同时开启,截止到9月3日...

CVPR2024|vivo提出使用对抗微调获得泛化性更强的SAM,分割直接登顶 SOTA!

本文介绍了一种名为ASAM(Adversarial Sample-based Adversarial Model)的新方法,旨在通过对抗微调来增强现有的Segment Anything Model(SAM)在图像分割任...

CVPR 2024 视频场景解析挑战赛第一名方案详解

本文介绍了一种基于不可靠伪标签的半监督视频语义分割方法,该方法在CVPR 2024的野外挑战赛中获得了视频场景解析的第一名。该方法首先在有标签数据上训练教师...

CVPR 2024 Highlight|一举实现多个CV任务SOTA!DCNv4: 动态与稀疏操作的高效融合

摘要:在计算机视觉领域,卷积神经网络(ConvNets)的性能很大程度上取决于其感受野的大小和形状。然而,传统卷积操作是固定的,无法适应图像内容的变化。为...

顶刊TPAMI 2024!黄高团队提出EfficientTrain++:高效视觉骨干训练方法

摘要:本文介绍了清华大学自动化系2019级直博生王语霖及其团队在IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI)上发表的论文《Ef...
12