Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |
Tags
- Programmers
- 3d generation
- text-to-image diffusion
- magic clothing
- DP
- text-to-video diffusion
- diffusion
- sonicdiffusion
- VirtualTryON
- instructany2pix
- objectdrop
- transformer
- sound-to-image generation
- Python
- dreamfusion
- novel view synthesis
- 논문리뷰
- insturctnerf2nerf
- BOJ
- text2room
- 프로그래머스
- visiontransformer
- 3d gaussian splatting
- Visual Autoregressive
- Vit
- 코테
- 3d editting
- 코딩테스트
- autoregressive
- 네이버 부스트캠프 ai tech 6기
Archives
- Today
- Total
목록text-to-image diffusion (1)
평범한 필기장
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bjpNLa/btsGJe3lp8A/5welEYkKwV9SJxS5lNwJV1/img.png)
1. Introduction 본 논문은 Imagen을 도입하는데 이는 text-to-image 합성에서 전례없는 정도의 photorealism과 깊은 수준의 언어 이해를 가져오기 위해 transformer language models와 high-fidelity diffusion model을 결합한 text-to-image diffusion model이다. Imagen의 key finding은 text-only corpora로 기학습된 large LM으로부터 text embedding이 text-to-image 합성에서 놀라운 효과적이라는 것이다. Imagen은 input text를 sequence of embeddings로 매핑하기 위한 frozen T5-XXL encoder와 $64 \times 64$..
AI/Diffusion
2024. 4. 20. 23:06