Visual Basic Speech Recognition Program

SilVar-Med: A Speech-Driven Visual Language Model for Explainable Abnormality Detection in Medical Imaging

Abstract: Medical Visual Language Models have shown great potential in various healthcare applications, including medical image captioning and diagnostic assistance. However, most existing models rely ...

IEEE

Lip Enhancement and Multi-View Simulation for Robust Visual Speech Recognition in MAVSR 2025

Abstract: In this paper, we present our work for Visual Speech Recognition (VSR) in the Mandarin Audio-Visual Speech Recognition (MAVSR) Challenge 2025, with a particular focus on improving lipreading ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

SilVar-Med: A Speech-Driven Visual Language Model for Explainable Abnormality Detection in Medical Imaging

Lip Enhancement and Multi-View Simulation for Robust Visual Speech Recognition in MAVSR 2025

Trending now