01 / 12
Lucrare de licență · sesiunea iulie 2026

Înțelegerea spațială a planurilor arhitecturale folosind segmentare și modele vizual-lingvistice

Implementare prin aplicația Mappa: planuri transformate automat în reprezentări structurate, editabile și interogabile.

Autor: Mario-Emanuel Teșcovschi Coordonator: Asist. Drd. Cristian Simionescu
Universitatea "Alexandru-Ioan Cuza" din Iași · Facultatea de informatică
derulează

Aproximativ o treime din cortexul uman este dedicată procesării informației vizuale.

Estimare din neuroștiința vizuală · Van Essen et al., 1992

Problema

Structura se pierde pe drum.

Planurile circulă ca imagini: poze, scanări, fișiere PDF. Structura editabilă dispare, iar recuperarea ei cere azi un specialist și timp, plan cu plan.

Putem reconstitui structura automat?
Plan arhitectural scanat, folosit ca intrare
O capcană intuitivă

De ce nu un singur model mare?

coordonate = text

Un model generalist scrie pozițiile ca text, token cu token, fără a le percepe pixel cu pixel.

Costul nu are noțiune de spațiu: o eroare de 5 pixeli și una de 50 se penalizează la fel.

Recunoaște bucătăria, dar ratează peretele. Și costă mult.
Soluția

Diviziunea muncii

Nu un model care le face pe toate, ci un pipeline din trei componente, fiecare bună la un singur lucru.

Geometrie

Un model de segmentare pune pereții și camerele la nivel de pixel.

Semantică

Un model vizual-lingvistic dă identitatea fiecărei camere.

Interacțiune

Un model de limbaj local: editezi și cauți în limbaj natural.

Arhitectura

Cum se leagă tot

Geometria și semantica sunt extrase în paralel, apoi fuzionate într-un singur document structurat și editabil.

Plan arhitectural de intrare
Plan de intrare
în paralel
Măști binare
Vectorizare + calibrare
Etichete + relații
Document structurat, vizualizat în aplicația Mappa
Document structurat
CanevasChatCăutarePrețExport
Geometria, în practică

Pereții, trasați corect

Stânga: planul brut. Dreapta: segmentarea pereților, camerelor, ușilor și ferestrelor

Stânga: planul brut. Dreapta: ce extrage modelul de segmentare. Gri sunt pereții, albastru ușile, bleu ferestrele.

Aplicația
Scenariul imobiliar

Căutare și estimare de preț

Fiecare plan devine un vector. Aceeași reprezentare alimentează căutarea semantică și estimarea de preț.

  • filtre extrase automat
  • fiecare plan devine un vector
  • ordonare după similaritate

Iar prețul estimat devine, la rândul lui, un criteriu după care poți căuta.

Preț estimat
288.380 €
Supraevaluat+31.8% față de estimare
Ce cântărește în estimare
nr. dormitoare-9.6%
nr. ferestre-9.4%
compactitate-6.0%
Pe baza a 61 de planuri evaluate
Rezultate

Mai bun decât un singur model mare

Comparație IoU pe clase: Mask2Former antrenat, CNN CubiCasa, Claude Opus monolitic
0.75 vs 0.25
IoU pe pereți, față de modelul monolitic
~10×
mai ieftin pe imagine
local
geometria rulează offline, pe CPU

Pe semantică rămâne aproape de un model mare (F1 0.45 față de 0.52). Câștigul decisiv este pe geometrie și pe cost.

Contribuții

Ce rămâne

  • 01Un pipeline hibrid care separă geometria (segmentare) de semantică (model vizual-lingvistic).
  • 02Un model de segmentare antrenat pe CubiCasa5k pentru planuri rezidențiale.
  • 03Aplicația Mappa: editare pe un canevas de tip CAD, limbaj natural și export.
  • 04Căutare în limbaj natural peste un portofoliu de planuri, cu estimare de preț.
Direcții viitoare set de date mai variat fine-tuning pe semantică
Mappa

Mulțumesc

Aștept întrebările voastre.
Mario-Emanuel Teșcovschi