状态

进行中

屏幕截图 2025-07-10 174726.jpg

PRCV 2025 基于大模型的AIGC图像质量评估挑战赛

以大模型为核心的生成式人工智能(AIGC)技术正迅猛发展,文本生成图像(Text-to-Image)作为多模态大模型的代表性应用,以前所未有的速度重塑艺术创作、视觉设计、数字娱乐等众多领域,展现出强大的创造力和广阔前景。多模态大模型能够根据文本提示生成高度逼真或富有创意的图像,但其输出质量存在显著波动。伴随着技术能力的提升,如何建立一套客观、精准且覆盖多维度的评价体系,科学的衡量AIGC图像的质量与图文匹配度,已成为推动该技术深化应用与可持续发展的核心挑战。我们期望参赛者充分挖掘多模态大模型在深度理解图像内容、精准对齐语义等方面的判别潜能,探索大模型作为“AI评委”在自动化、智能化评价其他大模型生成图像任务上的方法边界与最佳实践。

PRCV 2025 基于大模型的AIGC图像质量评估挑战赛

以大模型为核心的生成式人工智能(AIGC)技术正迅猛发展,文本生成图像(Text-to-Image)作为多模态大模型的代表性应用,以前所未有的速度重塑艺术创作、视觉设计、数字娱乐等众多领域,展现出强大的创造力和广阔前景。多模态大模型能够根据文本提示生成高度逼真或富有创意的图像,但其输出质量存在显著波动。伴随着技术能力的提升,如何建立一套客观、精准且覆盖多维度的评价体系,科学的衡量AIGC图像的质量与图文匹配度,已成为推动该技术深化应用与可持续发展的核心挑战。我们期望参赛者充分挖掘多模态大模型在深度理解图像内容、精准对齐语义等方面的判别潜能,探索大模型作为“AI评委”在自动化、智能化评价其他大模型生成图像任务上的方法边界与最佳实践。

了解更多

进行中

屏幕截图 2025-07-10 174726.jpg

PRCV 2025 超高速脉冲视觉数据集及开放任务挑战赛

近年来,基于脉冲相机(spike camera)的视觉研究正快速发展。不同于传统帧式成像,脉冲相机受启发于生物视觉系统,其每个像素独立根据光强变化主动发放脉冲信号,采样频率最高可达 40,000Hz。其输出形式为二值脉冲的时空阵列(0/1脉冲信号),具有极高的时间分辨率与出色的动态感知能力,特别适用于高速运动、高动态范围、连续变化等复杂场景。与此同时,脉冲视觉也面临前沿挑战:由于其数据形式全新,传统图像算法和评估机制难以直接适用,亟需开发适配脉冲数据的新型视觉算法和构建适应性强的开放基准。本次挑战赛将举办数据集与基准评测和新应用与开放研究挑战赛。

PRCV 2025 超高速脉冲视觉数据集及开放任务挑战赛

近年来,基于脉冲相机(spike camera)的视觉研究正快速发展。不同于传统帧式成像,脉冲相机受启发于生物视觉系统,其每个像素独立根据光强变化主动发放脉冲信号,采样频率最高可达 40,000Hz。其输出形式为二值脉冲的时空阵列(0/1脉冲信号),具有极高的时间分辨率与出色的动态感知能力,特别适用于高速运动、高动态范围、连续变化等复杂场景。与此同时,脉冲视觉也面临前沿挑战:由于其数据形式全新,传统图像算法和评估机制难以直接适用,亟需开发适配脉冲数据的新型视觉算法和构建适应性强的开放基准。本次挑战赛将举办数据集与基准评测和新应用与开放研究挑战赛。

了解更多

已结束

分图3.jpg

Mobile AI 2025 挑战赛

在过去的几年里,基于 AI 的移动应用变得越来越普及。如今,各类深度学习模型已经广泛部署在各种移动设备上:从运行人像分割、图像增强、人脸识别和自然语言处理模型的智能手机,到配备先进图像超分辨率算法的智能电视主板。与此同时,移动设备中的 NPU(神经网络处理器)和 DSP(数字信号处理器)性能也在快速提升,使得运行复杂的深度学习模型和实现大多数任务的快速推理成为可能。尽管近年来已有大量针对高效深度学习模型的研究工作被提出,但这些方法的评估大多是在桌面 CPU 或 GPU 上进行的,这使得我们难以准确估算其在真实移动硬件上的推理速度和内存消耗。为了解决这一问题,本次挑战赛的所有深度学习解决方案均面向移动设备开发并在移动平台上进行评估。借助新一代移动 AI 硬件的强大性能,本次研讨会所涉及的课题将不再局限于简单的分类任务,而是扩展到诸如图像去噪、HDR 摄影、精准深度估计、端到端学习的图像信号处理流程、实时图像与视频超分辨率等更具挑战性的研究方向。本次挑战赛将组织移动GPU上的RGB照片增强、智能手机ISP在移动GPU上的学习和在移动NPU上进行量化图像超分辨率等挑战赛。

Mobile AI 2025 挑战赛

在过去的几年里,基于 AI 的移动应用变得越来越普及。如今,各类深度学习模型已经广泛部署在各种移动设备上:从运行人像分割、图像增强、人脸识别和自然语言处理模型的智能手机,到配备先进图像超分辨率算法的智能电视主板。与此同时,移动设备中的 NPU(神经网络处理器)和 DSP(数字信号处理器)性能也在快速提升,使得运行复杂的深度学习模型和实现大多数任务的快速推理成为可能。尽管近年来已有大量针对高效深度学习模型的研究工作被提出,但这些方法的评估大多是在桌面 CPU 或 GPU 上进行的,这使得我们难以准确估算其在真实移动硬件上的推理速度和内存消耗。为了解决这一问题,本次挑战赛的所有深度学习解决方案均面向移动设备开发并在移动平台上进行评估。借助新一代移动 AI 硬件的强大性能,本次研讨会所涉及的课题将不再局限于简单的分类任务,而是扩展到诸如图像去噪、HDR 摄影、精准深度估计、端到端学习的图像信号处理流程、实时图像与视频超分辨率等更具挑战性的研究方向。本次挑战赛将组织移动GPU上的RGB照片增强、智能手机ISP在移动GPU上的学习和在移动NPU上进行量化图像超分辨率等挑战赛。

了解更多

已结束

分图5.jpg

CFAT 2024 人像复原挑战赛

近年来,随着多模态大模型技术的飞速进步,人像复原作为计算机视觉领域的前沿技术也得以快速发展。2024年9月起,视频图像信息智能分析与共享应用技术国家工程实验室(简称“视频国家工程实验室”,英文简称:NELIVA)与中国图象图形学学会(CSIG)继续携手,共同举办“CSIG FAT-AI 2024 人像复原挑战赛”(简称:CFAT 2024)。本届挑战赛给定模糊人脸图像及对应的自然语言描述、人脸轮廓图像,要求参赛者使用人像复原技术恢复出符合本人真实面容的高清人脸图像,在公共安全领域有着重要的应用价值,是国内人像复原领域面向安防应用的专业赛事。

CFAT 2024 人像复原挑战赛

近年来,随着多模态大模型技术的飞速进步,人像复原作为计算机视觉领域的前沿技术也得以快速发展。2024年9月起,视频图像信息智能分析与共享应用技术国家工程实验室(简称“视频国家工程实验室”,英文简称:NELIVA)与中国图象图形学学会(CSIG)继续携手,共同举办“CSIG FAT-AI 2024 人像复原挑战赛”(简称:CFAT 2024)。本届挑战赛给定模糊人脸图像及对应的自然语言描述、人脸轮廓图像,要求参赛者使用人像复原技术恢复出符合本人真实面容的高清人脸图像,在公共安全领域有着重要的应用价值,是国内人像复原领域面向安防应用的专业赛事。

了解更多

已结束

分图6.jpg

AIM 2024 挑战赛

图像处理是计算机视觉领域的一项关键任务,旨在恢复退化的图像内容、填充缺失信息,或进行必要的变换和/或操作以达到预期目标(就感知质量、内容或处理此类图像的应用程序的性能而言)。近年来,视觉和图形学界对这些基础研究课题的兴趣日益浓厚。不仅相关论文数量不断增加,而且取得了实质性进展。图像处理作为重要的前端技术,其每一次进步都简化了人类或计算机利用图像完成进一步任务的流程。因此,图像处理在监控、汽车工业、电子、遥感或医学图像分析等领域的应用范围日益广泛也就不足为奇了。移动和可穿戴设备的兴起和普及为更多应用和更快捷的方法提供了新的沃土。本次研讨会旨在概述这些领域的新趋势和进展。此外,它还将为学术界和工业界的与会者提供交流和探索合作的机会。本次挑战赛将组织高效的视频超分辨率、移动实时视频超分辨率和视频超分辨率质量评估等挑战赛。

AIM 2024 挑战赛

图像处理是计算机视觉领域的一项关键任务,旨在恢复退化的图像内容、填充缺失信息,或进行必要的变换和/或操作以达到预期目标(就感知质量、内容或处理此类图像的应用程序的性能而言)。近年来,视觉和图形学界对这些基础研究课题的兴趣日益浓厚。不仅相关论文数量不断增加,而且取得了实质性进展。图像处理作为重要的前端技术,其每一次进步都简化了人类或计算机利用图像完成进一步任务的流程。因此,图像处理在监控、汽车工业、电子、遥感或医学图像分析等领域的应用范围日益广泛也就不足为奇了。移动和可穿戴设备的兴起和普及为更多应用和更快捷的方法提供了新的沃土。本次研讨会旨在概述这些领域的新趋势和进展。此外,它还将为学术界和工业界的与会者提供交流和探索合作的机会。本次挑战赛将组织高效的视频超分辨率、移动实时视频超分辨率和视频超分辨率质量评估等挑战赛。

了解更多
1 2 跳转到