Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- magdiff
- 코딩테스트
- BOJ
- 논문리뷰
- diffusion model
- diffusion models
- transformer
- segmenation map generation
- dreammotion
- video editing
- controllable video generation
- Vit
- video generation
- DP
- 네이버 부스트캠프 ai tech 6기
- 3d generation
- Programmers
- masactrl
- Python
- score distillation
- VirtualTryON
- visiontransformer
- 코테
- diffusion
- 3d editing
- 프로그래머스
- image editing
- emerdiff
- segmentation map
- controlnext
Archives
- Today
- Total
목록네이버 부스트캠프 6기 (1)
평범한 필기장
[최종 프로젝트 일지 - 3주차] 멘토님 피드백 준비
다음주에 있을 멘토님 피드백을 대비해 어느 정도는 우리의 프로젝트가 틀이 잡혀야 했다. 그래서 나를 제외한 두 분은 product serving에 엄청 열중해 주셨다. 나는 ControlNet으로 옷 이미지 생성을 고도화 하는 것에 집중했다. Llava 이용 프로젝트에서 처음에 사용한 Multimodal VITON-HD 데이터셋은 https://arxiv.org/pdf/2304.02051.pdf에서 소개된 데이터 셋이다. 하지만 이 데이터셋을 보면 옷에 대한 설명인 text데이터가 만족스럽지 않다고 판단했다. 색에 대한 정보가 부족하다거나 여러 색을 지닌 옷이면 multicolor라는 단어로 퉁치는? 경우가 대부분으로 보여졌다. 그래서 나는 image captioning이나 vqa를 통해 옷 이미지에 대..
Experience/Naver Boostcamp 6기
2024. 3. 23. 23:50