Fake-HR1: Переосмислення міркувань візіонної мовної моделі для виявлення синтетичних зображень

Автори: Changjiang Jiang, Xinkuan Sha, Fengchang Yu, Jingjing Liu, Jian Liu, Mingqi Fang, Chenfeng Zhang, Wei Lu

Опубліковано: 2026-02-10

Переглянути на arXiv →
#cs.AI

Анотація

Останні дослідження показують, що міркування "ланцюжок думок" (CoT) може покращити виявлення синтетичних зображень, але тривалі міркування тягнуть за собою значні ресурсні витрати. Fake-HR1 пропонує великомасштабну гібридну модель міркувань, яка адаптивно визначає необхідність міркувань, виходячи з характеристик завдання генеративного виявлення. Вона використовує двохетапну структуру навчання: гібридне тонке налаштування (HFT) для ініціалізації з "холодного старту", за яким слідує онлайн-навчання з підкріпленням за допомогою гібридної оптимізації групової політики міркувань (HGRPO) для неявного навчання вибору режиму міркувань. Експериментальні результати демонструють, що Fake-HR1 адаптивно виконує міркування, перевершуючи існуючі LLM за здатністю до міркувань та продуктивністю генеративного виявлення, при цьому значно покращуючи ефективність відповіді.

Fake-HR1: Переосмислення міркувань візіонної мовної моделі для виявлення синтетичних зображень | ArXiv Intelligence