Пацієнт - це не рухомий документ: парадигма навчання світової моделі для поздовжніх електронних медичних карт
Ця стаття представляє нову парадигму навчання світової моделі, спеціально розроблену для поздовжніх електронних медичних карт (ЕЗК). Вона вирішує проблеми інтеграції та інтерпретації безперервних даних пацієнтів з часом, маючи на меті покращити здатність ШІ надавати більш точні та контекстно-орієнтовані відомості для застосувань у сфері охорони здоров'я.
cs.AI
Читати Аналіз →Світ робочих процесів: бенчмарк для інтеграції світових моделей у корпоративні системи
Це дослідження пропонує "Світ робочих процесів", бенчмарк, розроблений для полегшення інтеграції передових світових моделей ШІ в корпоративні системи. Він спрямований на оцінку та прискорення застосування ШІ у складних бізнес-процесах шляхом надання стандартизованої основи для тестування та розробки рішень ШІ, адаптованих для реальних корпоративних середовищ.
cs.AI
Читати Аналіз →Маршрутизація лотереї: адаптивні підмережі для гетерогенних даних
Ця стаття представляє Runtime Task Learning (RTL), адаптивний метод штучного інтегралу, який дозволяє моделям динамічно коригувати свої архітектури на основі вхідних гетерогенних даних. Він демонструє значні досягнення в таких областях, як класифікація зображень та покращення мовлення, відходячи від підходу "одна модель для всіх" для надання індивідуальних рішень та підвищення ефективності, досягаючи покращення точності до 5% на бенчмарках CIFAR-100.
cs.AI
Читати Аналіз →PhaseCoder: агностичне до геометрії мікрофона просторове аудіорозуміння для мультимодальних LLM
Ця стаття представляє PhaseCoder, кодер просторового аудіо, що базується виключно на трансформерах, який працює незалежно від геометрії мікрофона. Він обробляє необроблені багатоканальні аудіодані та координати мікрофона для виконання локалізації та генерації надійних просторових вбудувань. Це дозволяє мультимодальним великим мовним моделям (LLM) виконувати складні просторові міркування та цілеспрямовану транскрипцію з різних мікрофонних масивів.
cs.AI
Читати Аналіз →Solver-in-the-Loop: бенчмарки на основі MDP для самокорекції та поведінкової раціональності в дослідженні операцій
Ця робота представляє два нові бенчмарки, ORDebug та ORBias, які інтегрують вирішувач у цикл оцінювання для моделей ШІ. ORDebug оцінює ітеративну самокорекцію при вирішенні неможливих моделей дослідження операцій, тоді як ORBias оцінює поведінкову раціональність у випадках нового постачальника. Цей підхід спрямований на покращення діагностичних можливостей та можливостей самовідновлення великих мовних моделей у практичних умовах оптимізації.
cs.AI
Читати Аналіз →Дослідження моделі винагороди для міркувань агентів
Ця стаття зосереджена на розробці та дослідженні моделі винагороди для міркувань, призначеної для покращення можливостей агентів штучного інтелекту. Ймовірно, вона досліджує, як ефективно навчати агентів, надаючи винагороди, що узгоджуються зі складними процесами міркувань, що призводить до більш інтелектуальної та надійної поведінки агентів у різних застосуваннях.
cs.AI
Читати Аналіз →Модель умовного шумозаглушення як фізична сурогатна модель
Ця стаття досліджує використання моделей умовного шумозаглушення як фізичних сурогатних моделей для складних фізичних систем. Вона розглядає загальний компроміс між точністю підгонки даних та фізичною узгодженістю в сурогатному моделюванні. Цей підхід має потенціал для точного моделювання фізичних явищ, особливо в таких галузях, як фізика плазми.
cs.AI
Читати Аналіз →Самодосконалення попереднього навчання: використання післянавчених моделей для кращого попереднього навчання моделей
Фреймворк "Самодосконалення попереднього навчання" інтегрує цілі вирівнювання (безпека, фактичність, якість) безпосередньо в попереднє навчання великих мовних моделей (LLM), використовуючи потужну попередньо навчену модель як динамічний переписувач і суддю. Цей метод призводить до значних успіхів у узгодженості генерації та фактичності, підвищуючи надійність та достовірність великих мовних моделей для реального використання.
cs.AI
Читати Аналіз →Навчання логічних правил за допомогою LLM: масштабування людського досвіду для виявлення аномалій часових рядів
Цей фреймворк використовує великі мовні моделі (LLM) для кодування людського досвіду в інтерпретовані логічні правила для виявлення аномалій часових рядів у ланцюжках поставок. Він перевершує неконтрольовані методи за точністю та інтерпретованістю, а також пропонує послідовні, недорогі результати, придатні для розгортання у виробництві, долаючи розрив між автоматизацією та прийняттям експертних рішень.
cs.AI
Читати Аналіз →