DA-DPO: Економічна оптимізація переваг, що враховує складність, для зменшення галюцинацій MLLM

Автори: Longtian Qiu, Shan Ning, Chuyu Zhang, Jiaxuan Sun, Xuming He

Опубліковано: 2026-01-26

#cs.AI

Анотація

Ця робота представляє DA-DPO, економічно ефективний та чутливий до складності метод оптимізації переваг, спрямований на значне зменшення галюцинацій у мультимодальних великих мовних моделях (MLLM). Шляхом оптимізації на основі складності контенту, підхід покращує фактичну узгодженість та надійність виходів MLLM.

DA-DPO: Економічна оптимізація переваг, що враховує складність, для зменшення галюцинацій MLLM

Автори: Longtian Qiu, Shan Ning, Chuyu Zhang, Jiaxuan Sun, Xuming He

Опубліковано: 2026-01-26

Переглянути на arXiv →

#cs.AI

Анотація

FEEDBACK

Проекти

Немає проектів

DA-DPO: Економічна оптимізація переваг, що враховує складність, для зменшення галюцинацій MLLM | ArXiv Intelligence