
결론부터 말하면, 로컬 LLM과 이미지 생성을 같은 GPU에서 동시에 돌리면 둘 다 VRAM과 연산 자원을 강하게 쓰기 때문에 속도가 떨어집니다. 특히 작은 VRAM에서는 모델이 서로 밀어내며 대기나 오류가 생기기 쉽습니다.
먼저 가를 기준
판단 기준은 두 작업을 동시에 해야 하는지, 순서대로 돌려도 되는지입니다. LLM 모델 크기, 이미지 해상도, 배치 수, 백그라운드 그래픽 사용량을 같이 봐야 병목이 보입니다.
| 상황 | 판정 | 이유 |
|---|---|---|
| 갈래가 여러 개인 경우 | 시간·위치·대상 중 하나를 먼저 고릅니다 | 기준이 없으면 화면을 따라가도 마지막에 다시 갈립니다 |
| 이름이 비슷한 절차가 있는 경우 | 목적에 맞는 항목을 고릅니다 | 이름이 비슷해도 쓰임새가 다르면 대체가 안 됩니다 |
| 결과가 예상과 다른 경우 | 처음 입력한 조건부터 되짚습니다 | 대부분의 오류는 첫 조건 선택에서 생깁니다 |
| 순서 | 볼 것 | 판단 |
|---|---|---|
| 먼저 닫을 것 | 내 상황을 가르는 기준 하나 | |
| 다음에 볼 것 | 공식 화면에서 요구하는 입력값 | |
| 마지막 판단 | 다시 돌아오지 않게 남길 기록 |
실제로 갈리는 부분
실제로 갈리는 부분은 GPU 사용률이 100%가 아니면 여유가 있다고 생각하는 경우입니다. VRAM이 부족하면 속도보다 먼저 메모리 이동과 재로딩이 생기고, 체감은 갑자기 무거워집니다.
마치며
저는 한 장비에서 로컬 AI를 여러 개 돌릴 때는 욕심보다 순서가 중요하다고 봅니다. LLM과 이미지 생성을 나눠 실행하도록 닫아야 같은 GPU에서도 덜 답답합니다.











댓글 남기기