进行中
Pattern Recognition | Special Issue on Foundation Models and Prompting for Visual Tasks in Harsh Conditions
npj Imaging | Special Issue on Super-resolution Imaging
Visual Intelligence | Special Issue on Controllable Artificial Intelligence Visual Content Generation
00/00
共23条结果
各个领域的视频内容快速增长,导致对更智能、更高效的视频理解和评估技术的需求不断增长。本特刊重点介绍多模态信息(如音频、文本和传感器数据)与视频的集成,以增强处理、分析和解释。多模态驱动的方法对于许多实际应用至关重要,包括自动监控、内容推荐和医疗保健诊断。本期特刊邀请了有关视频捕获、压缩、传输、增强和质量评估等主题的前沿研究,以及深度学习、多模态融合和实时处理框架方面的进步。
“传感智能和机器学习”描述了人工智能 (AI) 和机器学习 (ML) 方法与传感器技术的结合。这种融合提高了传感器功能,提高了准确性、灵敏度和适应性。“传感智能和机器学习”的应用包括医疗保健和生物医学工程、自动驾驶汽车等。本特刊旨在探索深度学习在提高成像传感器分辨率和准确性方面的应用和在机器人技术中使用传感器融合和机器学习进行环境交互和导航。
基础模型的出现(如 CLIP、DINO、SAM、BLIP、Segment Anything 和扩散模型)彻底改变了视觉表征学习,使得零样本迁移和跨多种任务的统一建模成为可能。然而,在极端低光、浓雾、水下、运动模糊和低分辨率等恶劣视觉条件下,这些模型的鲁棒性和适应性仍未被充分探索,且高度依赖具体应用场景。本专刊诚邀原创研究文章,探讨如何适配、增强或微调基础模型及基于提示的学习范式,以在退化视觉环境下实现稳健性能。
在过去十年左右的时间里,以深度学习为代表的人工智能技术取得了显著的进步,尤其是在信号处理和计算机视觉领域。在这些领域,基于深度学习的方法正在以前所未有的速度迭代和商业化,极大地改变了人类的生活、学习和工作方式。近年来,图像和视频合成与生成、3D 视觉、视觉语言模型和多模态学习逐渐成为该领域的研究热点。本期特刊旨在突出图像和视频处理领域的最新突破和应用,并具有双重关注点。首先,它探讨了用于数据采集和可视化的尖端设备的新用途。其次,它深入研究了处理大规模数据集的新方法,利用现代模式识别和机器学习技术来推进图像分析的最新技术。
自 2010 年卷积神经网络复兴以来,计算机视觉一直是深度学习技术最具活力的领域之一。近年来,图像和视频合成与生成、3D 视觉、视觉语言模型和多模态学习逐渐成为该领域的研究热点。自然语言处理领域的大型语言模型 的变革浪潮激发了对其在计算机视觉中潜力的进一步探索。在这种情况下,AI 需要沉下来处理更多底层信号或硬件信息。本期特刊希望通过关注信号处理和计算机视觉领域 AI 技术的最新进展来记录和推动这一趋势。
超分辨率成像重新定义了光学可见的界限,解锁了以前无法获得的对生物系统的纳米级结构和动态行为的见解。与此同时,计算方法已成为该领域不可或缺的。先进的图像重建算法、降噪框架和基于深度学习的管道现在在提高分辨率、缩短采集时间、最大限度地减少光毒性以及从日益复杂的数据集中提取有意义的生物信息方面发挥着核心作用。本特刊旨在汇集超分辨率成像的最新进展,涵盖仪器、计算方法和跨学科变革性应用方面的创新。
高光谱遥感技术具有诊断性高光谱分辨率,擅长捕捉材料连续和精细的反射特性,广泛应用于生态系统生态学、地质学、城市规划、精准农业、国防、湿地监测等领域。在人工智能飞速发展的时代,可以采用新颖的图像处理和信息提取技术来更智能地挖掘高光谱遥感数据特征。通过结合多源和多模态数据的互补特征,地球科学先验知识与人工智能的融合,使高光谱遥感技术能够实现对复杂地理过程和人类活动的更全面、更深入的理解。为了及时全面地捕捉高光谱遥感的最新进展,本特刊寻求从地块到卫星层面的尖端高光谱遥感应用方面的贡献。本特刊还寻求利用智能图像处理和信息提取技术更有效地利用高光谱数据立方体中包含的大量输入的贡献。
图像着色是将灰度图像转换为具有自然感官和视觉质量的彩色图像的过程。图像着色任务是一个典型的计算机视觉问题,尤其是红外图像着色 它一直受到学者的广泛关注。红外图像是通过检测红外辐射获得的,广泛应用于军事、安防监控、医学和地质勘探等领域。但是,由于红外图像的特殊性质,它们缺乏颜色信息,因此对红外图像进行着色可以使观察者更容易理解和分析图像内容。近年来,图像着色技术在自然图像和红外图像领域取得了重要进展,特别是最新的基于深度学习的图像着色算法不断被提出,对许多应用领域具有重要意义,如医疗诊断、遥感、艺术创作、夜视等特殊应用领域。
近年来,视觉与语言、音频和传感器信号等互补模式的集成已成为在非结构化环境中运行的智能系统的关键推动因素。基础模型和跨模态预训练的出现为该领域带来了范式转变,因此是时候重新审视多模态视觉理解中的核心挑战和创新技术了。本特刊旨在收集前沿的研究和工程实践,通过多模态学习促进对视觉智能系统的理解和发展。重点是将视觉信息与文本、音频和传感器数据等互补模态深度集成,从而在真实环境中实现更全面的感知和推理。