Alibabas KI-Forschungsteam Qwen hat mit QVQ-72B-Preview ein neues Open-Source-Sprachmodell vorgestellt, das komplexe Schlussfolgerungen aus Bildern ziehen kann. Das Modell übertrifft bisherige Ansätze deutlich, ist aber noch experimentell.
Der Artikel Qwens QVQ-72B ist das erste Open-Source-Modell für anspruchsvolles visuelles Schlussfolgern erschien zuerst auf THE-DECODER.de.