
🔗 https://arxiv.org/pdf/2505.00662.pdfLLM, 자신의 실수를 스스로 찾아내게 만들기: DeepCritic 이 논문이 왜 중요한가요?거대 언어 모델(LLM)이 계속 발전하려면 자신의 결과물을 스스로 검토하고 개선하는 능력이 중요합니다.사람이 모든 LLM 결과물을 일일이 확인하고 피드백을 주는 것은 너무 비싸고 어렵습니다.따라서 LLM을 '비평가'로 사용하여 자동 감독하는 방식이 주목받고 있지만, 기존 LLM 비평가는 오류를 깊이 파고들지 못하고 피상적인 비판만 하는 한계가 있었습니다.이 논문은 LLM이 단순히 맞고 틀림을 넘어, 왜, 어디서 틀렸는지 그 과정을 '의도적으로' 깊이 파헤치는 비판 능력을 갖추도록 훈련하는 방법을 제시하며, 이는 LLM의 자기 개선과 신뢰성 향상..