LLM tabanlı sistemlerde kaliteyi değerlendirmek, klasik “doğru–yanlış” eksenine indirgenemeyecek kadar çok boyutlu bir problemdir. Bu durum, özellikle Retrieval Augmented Generation (RAG) mimarilerinde daha da belirgin hâle gelir; çünkü üretilen cevabın…
