반응형
SMALL

전체 글 92

[논문리뷰] Kimi-VL Technical Report

2.8B 파라미터로 GPT-4o를 능가?! 효율적인 오픈소스 VLM, Kimi-VL(https://arxiv.org/pdf/2504.07491.pdf)✨ 서론: 작지만 강하다! 새로운 오픈소스 VLM, Kimi-VL의 등장핵심 포인트AI 비서의 미래: 텍스트 넘어 이미지, 영상 이해하는 멀티모달 AI가 필수!오픈소스 VLM의 한계: GPT-4o, Gemini 같은 강력한 모델은 있지만, 오픈소스는 아직 부족 😭Kimi-VL: 이런 아쉬움을 달래줄 ✨ 효율적인 오픈소스 VLM ✨ 등장!가볍지만 강력: 단 2.8B 활성 파라미터로 최첨단 모델과 경쟁!다재다능: 멀티모달 추론, 긴 문맥 이해, 에이전트 능력까지!쉽게 풀어쓰기마치 "작은 고추가 맵다" 라는 속담처럼, Kimi-VL은 겉보기엔 작지만 엄청난 능..

AI논문 2025.04.13

[논문리뷰] ZClip: Adaptive Spike Mitigation for LLM Pre-Training

💥 LLM 학습 중 Loss 스파이크 문제, ZClip이 해결해 줄 수 있을까? (https://arxiv.org/pdf/2504.02507) 📌 서론: 거대 언어 모델, Loss 스파이크 때문에 골치 아프다고? 🤯거대 언어 모델(LLM)은 자연어 처리 분야를 혁신했지만, 학습 과정이 험난해. 😭특히 Loss 스파이크라는 갑작스러운 Loss 값 폭등 현상은 모델 성능을 망치고, 심하면 학습을 중단시켜야 할 수도 있어. 💥마치 운전하다가 갑자기 브레이크가 고장나는 것처럼 😱Loss 스파이크는 모델 학습을 불안정하게 만들고, 추가적인 계산 비용과 시간을 발생시켜. ⏰ 💸덤으로 환경 오염까지! 🌍 😥핵심 포인트LLM 학습의 주요 문제점은 Loss Sp이크! 💥Loss Sp이크는 학습 불안정,..

AI논문 2025.04.13
반응형
LIST