๋ธ๋๋ฐ์ค ์์์์ ํ๋ฆฟํ ์๋์ฐจ ๋ฒํธํ์ ๊ณ ํ์ง๋ก ๋ณต์ํ๋ ๋ฅ๋ฌ๋ ๊ธฐ๋ฐ ํ์ง ๊ฐ์ ์์คํ ์ ๋๋ค.
- DeepLabV3 ๊ธฐ๋ฐ ๋ฒํธํ ์ธ๊ทธ๋ฉํ ์ด์
- FlowFormer++ ๊ธฐ๋ฐ Optical Flow ์ถ์ ๋ฐ Refinement
- ์๊ณต๊ฐ์ ์ผ๊ด์ฑ ๋ณด์ ์ ํตํ ํ๋ ์ ์ ๋ ฌ
- CLAHE๋ฅผ ํตํ ๋๋น ํฅ์
- Scene Text ๊ธฐ๋ฐ ๋ณต์ ๋ชจ๋ธ(TCDM)์ ํ์ฉํ ํ์ฒ๋ฆฌ
- Python 3.8+
- PyTorch, OpenCV
- DeepLabV3, FlowFormer++
- TCDM (Text Conditional Diffusion Model)
- CUDA 11.3 ์ด์
- DeepLabV3๋ก ๋ฒํธํ ์์ญ ์ถ์ถ โ ๊ณ ์ ๋น์จ(4:1)๋ก ์ ์ํ๋ง
- Homography๋ฅผ ์ด์ฉํด ์์ ๋ณด์
- ์ต์ข ์ ์ผ๋ก 1์ฅ์ Pseudo-GT + 31์ฅ์ LR ๋ฒํธํ ํ๋ ์์ผ๋ก ๊ตฌ์ฑ
- FlowFormer++๋ฅผ ํตํด ๊ฐ ํ๋ ์์ ์์ง์ ์ถ์
- Temporal/Spatial Smoothness ๊ธฐ๋ฐ ์ค๋ฅ ๋ณด์ ์ํ
- ๊ธฐ์ค ํ๋ ์์ผ๋ก ๋ชจ๋ ํ๋ ์ ์ ๋ ฌ (De-warping)
- ์ ๋ ฌ๋ ํ๋ ์๋ค์ ์ง๊ณํ์ฌ ํ๋์ ์ด๋ฏธ์ง๋ก ์์ฑ
- CLAHE๋ก ๋๋น ๊ฐ์
- TCDM์ผ๋ก Scene Text Prior๋ฅผ ํ์ฉํ ๋ณต์ ํฅ์
-
DeepLabV3 ๊ธฐ๋ฐ ๋ฒํธํ ์ธ๊ทธ๋ฉํ ์ด์
- ๋ฒํธํ ์์ญ ๊ฒ์ถ ๋ชจ๋ธ ๊ตฌํ ๋ฐ ์ต์ ํ
- Precision 89%, Recall 87.5% ๋ฌ์ฑ
- Homography ๊ธฐ๋ฐ ์์ ๋ณด์ ์๊ณ ๋ฆฌ์ฆ ๊ฐ๋ฐ
-
TCDM ๊ธฐ๋ฐ ํ์ฒ๋ฆฌ
- Scene Text Prior๋ฅผ ํ์ฉํ ๋ฒํธํ ๋ณต์ ๋ชจ๋ธ ๊ตฌํ
- Hallucination ํ์ ์ ๊ฑฐ ๋ฐ ๋ณต์ ์ ํ๋ ํฅ์
- ESRGAN, SwinIR ๋ฑ ๊ธฐ์กด ๋ชจ๋ธ ๋๋น ์ฐ์ํ ์ฑ๋ฅ ๋ฌ์ฑ
| Metric | Value |
|---|---|
| Precision | 0.890 |
| Recall | 0.875 |
- ํ๊ท RMSE 3.71% ๊ฐ์
- Worst 30% frame ๊ธฐ์ค RMSE 13.37% ๊ฐ์
- ESRGAN, SwinIR, TATT ๋ฑ ์ต์ ๋ชจ๋ธ๋ค๊ณผ ๋น๊ต
- Hallucination ํ์ ์์ด ๋ฒํธํ ๋ณต์ ์ ํ๋ ์ฐ์
.
โโโ Data/ # ์
๋ ฅ/์ถ๋ ฅ ๋ฐ์ดํฐ
โโโ DT_core/ # ๋ฒํธํ Detection (DeepLabV3)
โโโ FF_core/ # Optical Flow ๋ณด์ (FlowFormer++)
โโโ FlowFormerPlusPlus/ # FlowFormer++ ์๋ณธ ์ฝ๋
โโโ TCDM/ # ํ์ฒ๋ฆฌ์ฉ ํ
์คํธ ๊ธฐ๋ฐ ๋ณต์ ๋ชจ๋ธ
โโโ scripts/ # ์คํ ์คํฌ๋ฆฝํธ ๋ชจ์
โโโ main.py # ๋ฉ์ธ ์คํ ์คํฌ๋ฆฝํธ
conda env create -f environment.yaml
conda activate SR- model_v2.pth โ
DT_core/์ ์ ์ฅ
# ๋ฉ์ธ ์คํ
python main.py- UI์์ ์์ ํ์ผ ๋๋๊ทธ & ๋๋กญ
- ๋ฒํธํ ์์ (์ด ๋จ์) ์ ๋ ฅ โ ์ฐจ๋/๋ฒํธํ ์์ญ ์ ํ โ ์๋ ๋ณต์ ์ํ
- NC& ๊ธฐ์
๊ณผ ์ฐํ๊ณผ์ ์๋ฃ
- ์ค์ ๋ธ๋๋ฐ์ค ๋ฐ์ดํฐ ๊ธฐ๋ฐ ๋ชจ๋ธ ๊ฒ์ฆ
- ๊ธฐ์ ์๊ตฌ์ฌํญ์ ๋ง์ถ ์์คํ ์ต์ ํ
- ์ฑ๊ณต์ ์ธ ์ฐํํ๋ ฅ ํ๋ก์ ํธ ์๋ฃ


