Общая схема
Пайплайн состоит из трёх ключевых стадий: парсинг тела пользователя, ретопология одежды на сетку фигуры, финальный рендер с диффузионной моделью.
Парсинг тела
Используем кастомный fork SMPL-X, дообученный на нашем датасете из ~140 000 размеченных образов. На выходе получаем 3D-меш фигуры пользователя.
Ретопология одежды
Каждый товар при загрузке проходит через сегментацию и упрощение в трёхмерную сетку. На пользовательском теле мы натягиваем эту сетку с учётом физики ткани.
Финальный рендер
Диффузионная модель дорисовывает текстуры, тени и складки. Среднее время — 1,4 секунды на образ.
result = pipeline.run(
user_photo=photo,
garment_id=sku,
pose='front',
)

