Пацієнт - це не рухомий документ: парадигма навчання світової моделі для поздовжніх електронних медичних карт
Ця стаття представляє нову парадигму навчання світової моделі, спеціально розроблену для поздовжніх електронних медичних карт (ЕЗК). Вона вирішує проблеми інтеграції та інтерпретації безперервних даних пацієнтів з часом, маючи на меті покращити здатність ШІ надавати більш точні та контекстно-орієнтовані відомості для застосувань у сфері охорони здоров'я.
cs.AI
Читати далі →Світ робочих процесів: бенчмарк для інтеграції світових моделей у корпоративні системи
Це дослідження пропонує "Світ робочих процесів", бенчмарк, розроблений для полегшення інтеграції передових світових моделей ШІ в корпоративні системи. Він спрямований на оцінку та прискорення застосування ШІ у складних бізнес-процесах шляхом надання стандартизованої основи для тестування та розробки рішень ШІ, адаптованих для реальних корпоративних середовищ.
cs.AI
Читати далі →Маршрутизація лотереї: адаптивні підмережі для гетерогенних даних
Ця стаття представляє Runtime Task Learning (RTL), адаптивний метод штучного інтегралу, який дозволяє моделям динамічно коригувати свої архітектури на основі вхідних гетерогенних даних. Він демонструє значні досягнення в таких областях, як класифікація зображень та покращення мовлення, відходячи від підходу "одна модель для всіх" для надання індивідуальних рішень та підвищення ефективності, досягаючи покращення точності до 5% на бенчмарках CIFAR-100.
cs.AI
Читати далі →PhaseCoder: агностичне до геометрії мікрофона просторове аудіорозуміння для мультимодальних LLM
Ця стаття представляє PhaseCoder, кодер просторового аудіо, що базується виключно на трансформерах, який працює незалежно від геометрії мікрофона. Він обробляє необроблені багатоканальні аудіодані та координати мікрофона для виконання локалізації та генерації надійних просторових вбудувань. Це дозволяє мультимодальним великим мовним моделям (LLM) виконувати складні просторові міркування та цілеспрямовану транскрипцію з різних мікрофонних масивів.
cs.AI
Читати далі →Solver-in-the-Loop: бенчмарки на основі MDP для самокорекції та поведінкової раціональності в дослідженні операцій
Ця робота представляє два нові бенчмарки, ORDebug та ORBias, які інтегрують вирішувач у цикл оцінювання для моделей ШІ. ORDebug оцінює ітеративну самокорекцію при вирішенні неможливих моделей дослідження операцій, тоді як ORBias оцінює поведінкову раціональність у випадках нового постачальника. Цей підхід спрямований на покращення діагностичних можливостей та можливостей самовідновлення великих мовних моделей у практичних умовах оптимізації.
cs.AI
Читати далі →Дослідження моделі винагороди для міркувань агентів
Ця стаття зосереджена на розробці та дослідженні моделі винагороди для міркувань, призначеної для покращення можливостей агентів штучного інтелекту. Ймовірно, вона досліджує, як ефективно навчати агентів, надаючи винагороди, що узгоджуються зі складними процесами міркувань, що призводить до більш інтелектуальної та надійної поведінки агентів у різних застосуваннях.
cs.AI
Читати далі →Модель умовного шумозаглушення як фізична сурогатна модель
Ця стаття досліджує використання моделей умовного шумозаглушення як фізичних сурогатних моделей для складних фізичних систем. Вона розглядає загальний компроміс між точністю підгонки даних та фізичною узгодженістю в сурогатному моделюванні. Цей підхід має потенціал для точного моделювання фізичних явищ, особливо в таких галузях, як фізика плазми.
cs.AI
Читати далі →Самодосконалення попереднього навчання: використання післянавчених моделей для кращого попереднього навчання моделей
Фреймворк "Самодосконалення попереднього навчання" інтегрує цілі вирівнювання (безпека, фактичність, якість) безпосередньо в попереднє навчання великих мовних моделей (LLM), використовуючи потужну попередньо навчену модель як динамічний переписувач і суддю. Цей метод призводить до значних успіхів у узгодженості генерації та фактичності, підвищуючи надійність та достовірність великих мовних моделей для реального використання.
cs.AI
Читати далі →Навчання логічних правил за допомогою LLM: масштабування людського досвіду для виявлення аномалій часових рядів
Цей фреймворк використовує великі мовні моделі (LLM) для кодування людського досвіду в інтерпретовані логічні правила для виявлення аномалій часових рядів у ланцюжках поставок. Він перевершує неконтрольовані методи за точністю та інтерпретованістю, а також пропонує послідовні, недорогі результати, придатні для розгортання у виробництві, долаючи розрив між автоматизацією та прийняттям експертних рішень.
cs.AI
Читати далі →Як ШІ впливає на формування навичок
Це дослідження експериментально вивчає, як допомога ШІ впливає на набуття людських навичок, показуючи, що, хоча вона не постійно покращує негайну продуктивність для нових навчальних завдань, вона значно перешкоджає формуванню основних навичок, таких як налагодження та концептуальне розуміння. Дослідження показує, що стиль взаємодії ШІ визначає результати навчання, причому пасивна делегація призводить до гіршого розвитку навичок. Це має вирішальне значення для освіти та навчання на робочому місці в епоху ШІ.
cs.AI✓ AI аналіз
Читати далі →DynamicVLA: Модель зору, мови та дії для маніпуляції динамічними об'єктами
DynamicVLA представляє компактну модель бачення-мови-дії з 0,4 млрд параметрів та бенчмарк Dynamic Object Manipulation (DOM), що дозволяє роботам надійно маніпулювати рухомими об'єктами в реальних сценаріях. Модель досягає чудових показників успіху в симуляції DOM та стабільної продуктивності на фізичних роботах, що означає стрибок у можливостях роботизованої маніпуляції.
cs.AI
Читати далі →Прагматична базова модель VLA
LingBot-VLA – це базова модель зору-мови-дії, попередньо навчена на 20 000 годин реальних даних роботів з кількома втіленнями. Вона демонструє, що продуктивність моделі VLA масштабується зі збільшенням обсягу даних без насичення, досягаючи чудових показників успіху в 100-задачному бенчмарку реального світу на трьох робототехнічних платформах та покращуючи ефективність навчання. Це безпосередньо сприяє розвитку практичної робототехніки.
cs.AI
Читати далі →Ілюзія проникливості в моделях міркування
Ця стаття досліджує феномен "ілюзії проникливості" в моделях міркування ШІ, де моделі можуть здаватися такими, що мають справжнє розуміння, насправді не володіючи ним. Дослідження критично вивчає механізми, що лежать в основі таких ілюзій, та їх наслідки для довіри та пояснюваності систем штучного інтелекту.
cs.AI
Читати далі →Прогресивна ідеація з використанням агентного ШІ-фреймворку для спільної творчості людини та ШІ
У роботі представлено агентний ШІ-фреймворк, призначений для полегшення спільної творчості людини та ШІ через прогресивну ідеацію. Ця структура дозволяє ітеративну розробку ідей, поєднуючи людську креативність з генеративними можливостями ШІ для пошуку нових рішень у різних творчих сферах.
cs.AI
Читати далі →Mortar: Розвиваюча механіка для автоматичного ігрового дизайну
У статті представлено Mortar, систему, яка використовує механіку, що розвивається, для автоматичного дизайну ігор. Цей підхід, керований ШІ, може генерувати нові правила гри та взаємодії, маючи на меті прискорити процес розробки ігор та сприяти інноваційним ігровим враженням без ручного втручання.
cs.AI
Читати далі →Від глини до коду: типологічне та матеріальне осмислення в інтерпретаціях іранських голуб'ятень штучним інтелектом
Це дослідження вивчає здатність ШІ інтерпретувати та осмислювати архітектурну спадщину, зокрема іранські голуб'ятні, використовуючи типологічне та матеріальне осмислення. Воно демонструє, як ШІ може сприяти розумінню та збереженню культурних артефактів шляхом перетворення складних архітектурних даних у обчислювані форми.
cs.AI
Читати далі →DA-DPO: Економічна оптимізація переваг, що враховує складність, для зменшення галюцинацій MLLM
Ця робота представляє DA-DPO, економічно ефективний та чутливий до складності метод оптимізації переваг, спрямований на значне зменшення галюцинацій у мультимодальних великих мовних моделях (MLLM). Шляхом оптимізації на основі складності контенту, підхід покращує фактичну узгодженість та надійність виходів MLLM.
cs.AI
Читати далі →Адаптивне виявлення причинно-наслідкової координації для соціальних мереж: керована пам'яттю структура з напівкерованим навчанням
Ця стаття пропонує керовану пам'яттю структуру з напівкерованим навчанням для виявлення адаптивної причинно-наслідкової координації в соціальних мережах. Підхід спрямований на виявлення складних, розвиваючих моделей координації, що є критично важливим для розуміння та пом'якшення поширення дезінформації та скоординованих шкідливих дій в Інтернеті.
cs.AI
Читати далі →Мультиалгоритмічний підхід до балансування робочого навантаження людських ресурсів в міській системі доставки "останньої милі"
Ця стаття пропонує мультиалгоритмічний підхід для оптимізації балансування робочого навантаження людських ресурсів у міських системах доставки "останньої милі". Методологія спрямована на підвищення операційної ефективності та розподілу ресурсів шляхом інтелектуального розподілу завдань, що призводить до кращих термінів доставки та зниження витрат.
cs.AI
Читати далі →Чи можуть семантичні методи покращити тактику командних видів спорту? Методологія для футболу з ширшими застосуваннями
Це дослідження вивчає, як семантичні методи можуть покращити тактичний аналіз у командних видах спорту, зокрема у футболі. У ньому представлена методологія, яка використовує ШІ для отримання глибших уявлень про ігрові стратегії, пропонуючи потенціал для покращення тренерської роботи, розвитку гравців та підтримки прийняття рішень у реальному часі у спорті.
cs.AI
Читати далі →Самодистиляція забезпечує безперервне навчання
Ця стаття представляє Self-Distillation Fine-Tuning (SDFT), метод, що дозволяє великим мовним моделям безперервно набувати нових навичок та знань з демонстрацій без катастрофічного забування. SDFT використовує навчання в контексті, застосовуючи саму модель як вчителя, перевершуючи традиційне тонке налаштування та дозволяючи моделям накопичувати численні навички з часом.
cs.AI
Читати далі →Однокрокова генерація зображень без латентного простору за допомогою потоків середніх значень пікселів
Дослідники представляють Pixel MeanFlow (pMF), генеративну модель, яка створює високоякісні зображення за один прохід мережі безпосередньо з шуму в піксельному просторі, не вимагаючи латентного кодувальника чи декодера. Цей метод досягає конкурентоспроможних показників FID на ImageNet з меншими обчислювальними витратами, розширюючи межі дифузійних/потокових генеративних моделей.
cs.AI
Читати далі →DeepSeek-OCR 2: Візуальний причинно-наслідковий потік
Ця робота представляє DeepSeek-OCR 2, досліджуючи новий кодувальник, DeepEncoder V2, здатний динамічно змінювати порядок візуальних токенів на основі семантики зображення. Натхненний людським візуальним сприйняттям, цей підхід спрямований на досягнення ефективного 2D-розуміння зображень за допомогою каскадних 1D-структур причинно-наслідкового міркування, пропонуючи нову архітектурну парадигму для візуально-мовних моделей.
cs.AI
Читати далі →AgentDoG: Діагностична система захисту для безпеки та надійності ШІ-агентів
Ця стаття представляє AgentDoG, діагностичну систему захисту для безпеки та надійності ШІ-агентів, що вирішує проблеми, пов'язані з автономним використанням інструментів та взаємодією з навколишнім середовищем. Вона забезпечує детальну діагностику ризиків та ієрархічну атрибуцію для траєкторій агентів, пропонуючи прозорість за межами бінарних міток для полегшення ефективного узгодження агентів.
cs.AI
Читати далі →CovAgent: Подолання "прокляття 30%" покриття мобільних додатків за допомогою агентного ШІ та динамічного інструментування
Ця стаття пропонує CovAgent, підхід на основі агентного ШІ для покращення тестування інтерфейсу користувача Android-додатків шляхом аналізу декомпільованого Smali-коду та графа переходів компонентів. Він обґрунтовує незадоволені умови активації, генерує скрипти динамічного інструментування та значно покращує покриття тестів у порівнянні з найсучаснішими фаззерами.
cs.AI✓ AI аналіз
Читати далі →Надзвичайно низька затримка виявлення об'єктів на периферійних пристроях для автономної навігації дронів
Ми представляємо високооптимізовану архітектуру нейронної мережі та фреймворк розгортання, що забезпечує виявлення об'єктів у реальному часі з надзвичайно низькою затримкою на периферійних пристроях з обмеженими ресурсами для автономної навігації дронів. Ця робота значно підвищує безпеку та ефективність у сферах доставки та спостереження.
cs.AI
Читати далі →Прозорий і надійний ШІ для виявлення фінансового шахрайства в реальному часі
Ми пропонуємо нову основу пояснювального ШІ, розроблену для виявлення фінансового шахрайства в реальному часі, що забезпечує як високу точність, так і чіткі, зрозумілі людині пояснення своїх прогнозів. Ця система підвищує довіру та відповідність нормативним вимогам у критично важливих фінансових програмах.
cs.AI
Читати далі →Багатоагентне навчання з підкріпленням для динамічного керування світлофорами в містах
Ця стаття представляє багатоагентну систему навчання з підкріпленням, яка динамічно оптимізує керування світлофорами в містах у реальному часі. Експериментальні результати демонструють значне зменшення заторів і часу в дорозі, що відкриває шлях для розумнішої міської інфраструктури.
cs.AI
Читати далі →Генерація адаптивного навчального контенту за допомогою великих мовних моделей для початкової та середньої освіти
Ми досліджуємо використання великих мовних моделей для адаптивної генерації персоналізованого навчального контенту для учнів початкових та середніх класів, що відповідає індивідуальним стилям та темпам навчання. Цей підхід обіцяє революціонізувати персоналізований досвід навчання та покращити освітні результати.
cs.AI
Читати далі →Прискорення відкриття нових матеріалів для твердотільних батарей за допомогою активного навчання та генеративних моделей
Це дослідження представляє платформу, керовану ШІ, яка поєднує активне навчання з генеративними моделями для значного прискорення відкриття та оптимізації нових матеріалів для високопродуктивних твердотільних батарей. Цей підхід має величезний потенціал для рішень зі зберігання сталої енергії.
cs.AI
Читати далі →