Чи можемо ми довіряти поясненням ШІ? Докази систематичного недоотримання у логіці мислення
Автори: Deep Pankajbhai Mehta
Опубліковано: 2026-01-15
Переглянути на arXiv →Анотація
Це дослідження вивчає надійність пояснень ШІ, зокрема зосереджуючись на логіці мислення у великих мовних моделях. Дослідження надає докази систематичного недоотримання, коли моделі ШІ не повністю розкривають усі фактори, що сприяють їхнім висновкам. Це підкреслює критичні виклики для побудови надійних систем ШІ в реальних програмах, де прозорість та підзвітність є надзвичайно важливими.