'LLaMa' 태그의 글 목록

[논문리뷰] PRIMA.CPP: Speeding Up 70B-Scale LLM Inference on Low-Resource Everyday Home Clusters

🏡 집에서도 70B 거대 언어 모델을?! Prima.cpp 쉽게 파헤쳐보기 💡🔗 https://arxiv.org/pdf/2504.08791.pdf짧은 요약최근 DeepSeek, Qwen 등 오픈소스 LLM이 발전하면서, 전문가가 아닌 일반 사용자들도 최첨단 AI를 개인 기기에서 사용하고 싶다는 니즈가 커지고 있어요.하지만 70B(700억 매개변수)와 같이 거대한 모델은 높은 사양의 GPU, RAM을 요구하기 때문에, 일반 가정에서 사용하는 PC, 폰으로는 구동하기 어려웠죠.이 논문에서는 prima.cpp라는 시스템을 개발하여, 집에 있는 여러 기기들을 연결하고 CPU, GPU, 저장 공간 등 자원을 효율적으로 사용하여 70B 모델을 빠르게 구동하는 방법을 제시합니다.고사양 장비 없이도 최신 AI 모..

AI논문 2025.04.15

« 2025/07 »

일

월

화

수

목

금

토

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

논문번역

LLaMa 2

티스토리툴바