A survey on knowledge-enhanced multimodal learning

M Lymperaiou, G Stamou - Artificial Intelligence Review, 2024 - Springer
Multimodal learning has been a field of increasing interest, aiming to combine various
modalities in a single joint representation. Especially in the area of visiolinguistic (VL) …

Large Language Models and Multimodal Retrieval for Visual Word Sense Disambiguation

A Kritharoula, M Lymperaiou, G Stamou - arXiv preprint arXiv:2310.14025, 2023 - arxiv.org
Visual Word Sense Disambiguation (VWSD) is a novel challenging task with the goal of
retrieving an image among a set of candidates, which better represents the meaning of an …

[PDF][PDF] Αυτόματη παραγωγή εικόνων μόδας με χρήση προτροπής σε γενετικά μοντέλα μηχανικής μάθησης

Γ Αργυρού - 2024 - dspace.lib.ntua.gr
Περίληψη Στο σύγχρονο τοπίο της μόδας, η σύγκλιση τεχνολογίας και δημιουργικότητας έχει
δημιουργήσει νέες ευκαιρίες και αναδρομολογήσει τα πρότυπα της βιομηχανίας. Στο …