Bei endoskopischen Computer-Vision-Anwendungen sind Echtzeitverarbeitung der Videodaten sowie geringe Latenzen für einen praktischen klinischen Einsatz maßgeblich. Gleichzeitig führt die kontinuierliche Hardwareweiterentwicklung zu einer stetigen Verbesserung der Bildauflösung. Eingangsbilddaten hoher Auflösung erfordern i. d. R. eine patchweise Verarbeitung, wobei durch Patch-Priorisierungsstrategien die Verarbeitung der Daten beschleunigt und Latenzen reduziert werden können. Mit der Bildsegmentierung als Beispielaufgabe wird im vorliegenden Beitrag untersucht, wie das Patch-Sampling zur Inferenzzeit als Reinforcement Learning (RL)-Problem formuliert werden kann. Anhand von synthetischen und realen Daten wird gezeigt, dass durch das entwickelte RL-basierte Patch-Priorisierungsmodell (PPM) eine beschleunigte Segmentierung relevanter Bildregionen realisiert werden kann.