Fake-HR1: Переосмислення міркувань візіонної мовної моделі для виявлення синтетичних зображень
Автори: Changjiang Jiang, Xinkuan Sha, Fengchang Yu, Jingjing Liu, Jian Liu, Mingqi Fang, Chenfeng Zhang, Wei Lu
Опубліковано: 2026-02-10
Переглянути на arXiv →Анотація
Останні дослідження показують, що міркування "ланцюжок думок" (CoT) може покращити виявлення синтетичних зображень, але тривалі міркування тягнуть за собою значні ресурсні витрати. Fake-HR1 пропонує великомасштабну гібридну модель міркувань, яка адаптивно визначає необхідність міркувань, виходячи з характеристик завдання генеративного виявлення. Вона використовує двохетапну структуру навчання: гібридне тонке налаштування (HFT) для ініціалізації з "холодного старту", за яким слідує онлайн-навчання з підкріпленням за допомогою гібридної оптимізації групової політики міркувань (HGRPO) для неявного навчання вибору режиму міркувань. Експериментальні результати демонструють, що Fake-HR1 адаптивно виконує міркування, перевершуючи існуючі LLM за здатністю до міркувань та продуктивністю генеративного виявлення, при цьому значно покращуючи ефективність відповіді.