llm-evaluation

1.Prometheus: 현실적이고 다양한 평가를 수행할 수 있는 오픈소스 평가 모델

post-thumbnail

2.PROMETHEUS 2: 직접 평가 및 응답 비교가 가능한 오픈소스 평가 모델 논문 정리

post-thumbnail

3.Galileo ChainPoll: 프롬프팅을 활용해 LLM 환각 현상을 완화하기

post-thumbnail

4.Galileo Luna: 440M 파라미터 모델로 RAG 환각 탐지하기

post-thumbnail

5.OffsetBias: 평가 모델의 편향성을 어떻게 해결할 수 있을까?

post-thumbnail