fix: remove outdated references from multimodal eval docs

MrSnapsClaws[bot] · MrSnapsClaws[bot] · commit c91eca72e3fc · 2026-02-16T10:33:21.000Z
diff --git a/evaluations/experiments/multimodal-evaluation.mdx b/evaluations/experiments/multimodal-evaluation.mdx
@@ -1,13 +1,13 @@
 ---
 title: Multimodal Evaluation — Images, PDFs, and Vision
 sidebarTitle: Multimodal Evaluation
-description: Evaluate image generation, virtual try-on, document parsing, and other multimodal AI pipelines with LLM-as-a-Judge vision models.
+description: Evaluate image generation, document parsing, and other multimodal AI pipelines with LLM-as-a-Judge vision models.
 ---
 
 LangWatch supports multimodal evaluation out of the box. You can evaluate image inputs and outputs using any vision-capable model (GPT-4o, GPT-5.2, Claude Sonnet, Gemini, etc.) through the built-in LLM-as-a-Judge evaluators — no custom code required.
 
 This covers common multimodal use cases:
-- **Image generation quality** — score outputs of diffusion models, GANs, or other image generators
+- **Image generation quality** — score outputs of image generation models
 - **Document parsing** — evaluate extracted metadata from PDFs and scanned documents
 - **Content moderation** — detect NSFW or low-quality uploaded images
 - **Visual QA** — evaluate answers to questions about images