Înțelegerea spațială a planurilor arhitecturale folosind segmentare și modele vizual-lingvistice
Implementare prin aplicația Mappa: planuri transformate automat în reprezentări structurate, editabile și interogabile.
Aproximativ o treime din cortexul uman este dedicată procesării informației vizuale.
Estimare din neuroștiința vizuală · Van Essen et al., 1992
Structura se pierde pe drum.
Planurile circulă ca imagini: poze, scanări, fișiere PDF. Structura editabilă dispare, iar recuperarea ei cere azi un specialist și timp, plan cu plan.
De ce nu un singur model mare?
Un model generalist scrie pozițiile ca text, token cu token, fără a le percepe pixel cu pixel.
Costul nu are noțiune de spațiu: o eroare de 5 pixeli și una de 50 se penalizează la fel.
Diviziunea muncii
Nu un model care le face pe toate, ci un pipeline din trei componente, fiecare bună la un singur lucru.
Geometrie
Un model de segmentare pune pereții și camerele la nivel de pixel.
Semantică
Un model vizual-lingvistic dă identitatea fiecărei camere.
Interacțiune
Un model de limbaj local: editezi și cauți în limbaj natural.
Cum se leagă tot
Geometria și semantica sunt extrase în paralel, apoi fuzionate într-un singur document structurat și editabil.



Pereții, trasați corect
Stânga: planul brut. Dreapta: ce extrage modelul de segmentare. Gri sunt pereții, albastru ușile, bleu ferestrele.
Căutare și estimare de preț
Fiecare plan devine un vector. Aceeași reprezentare alimentează căutarea semantică și estimarea de preț.
- filtre extrase automat
- fiecare plan devine un vector
- ordonare după similaritate
Iar prețul estimat devine, la rândul lui, un criteriu după care poți căuta.
Mai bun decât un singur model mare
Pe semantică rămâne aproape de un model mare (F1 0.45 față de 0.52). Câștigul decisiv este pe geometrie și pe cost.
Ce rămâne
- 01Un pipeline hibrid care separă geometria (segmentare) de semantică (model vizual-lingvistic).
- 02Un model de segmentare antrenat pe CubiCasa5k pentru planuri rezidențiale.
- 03Aplicația Mappa: editare pe un canevas de tip CAD, limbaj natural și export.
- 04Căutare în limbaj natural peste un portofoliu de planuri, cu estimare de preț.