DA-DPO: Економічна оптимізація переваг, що враховує складність, для зменшення галюцинацій MLLM
Автори: Longtian Qiu, Shan Ning, Chuyu Zhang, Jiaxuan Sun, Xuming He
Опубліковано: 2026-01-26
Переглянути на arXiv →Анотація
Ця робота представляє DA-DPO, економічно ефективний та чутливий до складності метод оптимізації переваг, спрямований на значне зменшення галюцинацій у мультимодальних великих мовних моделях (MLLM). Шляхом оптимізації на основі складності контенту, підхід покращує фактичну узгодженість та надійність виходів MLLM.