Natural Language Visual Grounding via Multimodal Learning, Natürliche Sprache Visual Grounding durch multimodales Lernen Mi, Jinpeng 2020 - E-Dissertationen der UHH - frei zugänglich