Chitta, Subrahmanyasarma, Shashi Thota, Sai Manoj Yellepeddi, Amit Kumar Reddy, and Ashok Kumar Pamidi Venkata. “Multimodal Deep Learning: Integrating Vision and Language for Real-World Applications”. Asian Journal of Multidisciplinary Research & Review 1, no. 2 (November 19, 2020): 262–282. Accessed September 19, 2024. https://ajmrr.org/journal/article/view/211.