최근 Gemma 3 소형 모델들을 활용해 영화 추천 도메인으로 SFT 및 LoRA 파인튜닝을 진행해 보았습니다. 실험 과정에서 소형 모델(SLM)의 지식 습득 능력에 대해 몇 가지 한계를 느껴 질문을 올립니다. [실험] 전체적인 튜닝과정은 아래 블로그에 여러 포스팅으로 기록을 남겼습니다. [직면한 문제] 영화의 경우에는 이미 모델이 지식을 가지고 있어서 파인튜닝이 가능했다고 생각합니다. 많은 조언부탁드립니다. CPT(Continue Pre-training) 등 다양한 경험을 공유해주시면 감사합니다.
https://seungsang.tistory.com/entry/…
근데, 제가 특정 도메인을 기반으로 하고 싶다면 어떻게 해야할까요?
소형 모델을 특정 도메인에 특화시키고 싶을 때, 부족한 파라미터 용량을 극복하고 효과적으로 도메인 지식을 주입할 수 있는 전략이 무엇이 있을까요?

1 month ago
10










English (US) ·