|
«Информатика и ее применения» (Том 15, Выпуск 2, 2021)
Оглавление | Об авторах
Управление линейным выходом марковской цепи по квадратичному критерию
- А. В. Босов Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, ABosov@frccsc.ru
Аннотация: Решена задача оптимального управления выходом стохастической системы наблюдения, в которой состояние определяет ненаблюдаемый марковский скачкообразный процесс, а линейные наблюдения задаются системой дифференциальных уравнений Ито с винеровским процессом. В наблюдения аддитивно входит управление, так что формируется управляемый выход системы. Цель оптимизации задается квадратичным критерием общего вида. Для решения задачи управления сформулирована теорема разделения, использующая решение задачи оптимальной фильтрации, обеспечиваемое фильтром Вонэма. В результате разделения формируется эквивалентная задача управления выходом диффузионного процесса частного вида, а именно: с линейным сносом и нелинейной диффузией. Решение этой задачи обеспечивается непосредственным применением метода динамического программирования.
Ключевые слова: марковский скачкообразный процесс; стохастическая дифференциальная система Ито; оптимальное управление; квадратичный критерий; стохастическая фильтрация; фильтр Вонэма
Фильтрация состояний марковских скачкообразных процессов по комплексным наблюдениям I: точное решение задачи
- А. В. Борисов Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук; Московской авиационный институт; Факультет вычислительной математики и кибернетики Московского государственного университета имени М. В. Ломоносова; Центр фундаментальной и прикладной математики Московского государственного университета имени М. В. Ломоносова, ABorisov@frccsc.ru
- Д. Х. Казанчян Факультет вычислительной математики и кибернетики Московского государственного университета имени М. В. Ломоносова, Drastamat94@gmail.com
Аннотация: Первая часть цикла посвящена решению задачи оптимальной фильтрации состояний марковских скачкообразных процессов (МСП) по совокупности наблюдаемых диффузионных и считающих процессов. Интенсивности шумов в наблюдаемой диффузии и скачков в разрывных наблюдениях зависят от оцениваемого состояния. Предложено специальное эквивалентное преобразование наблюдений, приводящее их к совокупности диффузионного процесса с единичной диффузией, множеству считающих процессов и совокупности косвенных наблюдений, выполненных в неслучайные дискретные моменты времени. Искомая оптимальная оценка представима в форме решения дискретно-непрерывной стохастической дифференциальной системы с преобразованными наблюдениями в правой части. Приведено условие идентифицируемости, при выполнении которого состояние МСП может быть восстановлено по косвенным зашумленным наблюдениям точно.
Ключевые слова: марковский скачкообразный процесс; оптимальная фильтрация; мультипликативные шумы в наблюдениях; непрерывные и считающие наблюдения; условия идентифицируемости
Об одной нестационарной модели обслуживания с катастрофами и тяжелыми хвостами
- А. И. Зейфман Вологодский государственный университет; Институт проблем информатики Федерального исследовательского центра "Информатика и управление " Российской академии наук; Вологодский научный центр Российской академии наук, a_zeifman@mail.ru
- Я. А. Сатин Вологодский государственный университет, yacovi@mail.ru
- И. А. Ковалёв Вологодский государственный университет, kovalev.iv96@yandex.ru
Аннотация: Рассматривается нестационарная система массового обслуживания с катастрофами, одним сервером и специальными групповыми поступлениями требований, причем интенсивности увеличивающихся групп требований могут убывать достаточно медленно. Рассмотрен процесс X(t), описывающий число требований в такой системе, доказано существование предельного режима распределения вероятностей состояний и предельного среднего для X (t), получены оценки скорости сходимости к предельному режиму и предельному среднему. Получены оценки аппроксимации с помощью усечений конечными процессами. В качестве примера рассмотрена простая модель нестационарной системы с достаточно медленной скоростью убывания интенсивностей поступления групп требований, когда размер группы растет.
Ключевые слова: нестационарная система массового обслуживания; счетные марковские цепи; предельные характеристики; скорость сходимости; аппроксимации
Многомерные распределения выходящих потоков в системе с абсолютным приоритетом
- В. Г. Ушаков Факультет вычислительной математики и кибернетики Московского государственного университета имени М. В. Ломоносова; Федеральный исследовательский центр "Информатика и управление" Российской академии наук, vgushakov@mail.ru
- Н. Г. Ушаков Институт проблем технологии микроэлектроники и особочистых материалов Российской академии наук; Норвежский научнотехнологический университет, Тронхейм, Норвегия, ushakov@math.ntnu.no
Аннотация: Изучена однолинейная система массового обслуживания с бесконечным числом мест для ожидания, произвольным распределением времени обслуживания и пуассоновскими входящими потоками требований. Между требованиями разных потоков действует дисциплина абсолютного приоритета с обслуживанием заново прерванного требования. Методом вложенных цепей Маркова исследуется многомерный случайный процесс, компоненты которого - число требований фиксированного приоритета в системе и длительность интервала времени между последовательными моментами ухода из системы требований этого приоритета. Найдены конечномерные распределения указанного процесса. В качестве следствия получены преобразования Лапласа-Стилтьеса одномерных и двумерных распределений выходящего потока требований каждого приоритета в стационарном режиме.
Ключевые слова: выходящий поток; абсолютный приоритет; вложенная цепь Маркова; одноканальная система
Анализ несмещенной оценки среднеквадратичного риска метода блочной пороговой обработки
- О. В. Шестаков Московский государственный университет имени М. В. Ломоносова, кафедра математической статистики факультета вычислительной математики и кибернетики; Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, oshestakov@cs.msu.ru
Аннотация: Методы обработки сигналов и изображений, основанные на вейвлет-разложении и пороговой обработке, приобрели большую популярность при решении задач подавления шума и компрессии. Это объясняется их адаптивностью к локальным особенностям исследуемых функций, высокой скоростью алгоритмов обработки и оптимальностью получаемых оценок. В данной работе рассмотрен метод блочной пороговой обработки, в котором коэффициенты разложения обрабатываются группами, что позволяет учитывать информацию о соседних коэффициентах. В модели с аддитивным шумом проведен анализ несмещенной оценки среднеквадратичного риска и показано, что при определенных условиях регулярности эта оценка является сильно состоятельной и асимптотически нормальной. Данные свойства позволяют использовать оценку риска в качестве критерия качества метода и строить асимптотические доверительные интервалы для теоретического среднеквадратичного риска.
Ключевые слова: вейвлеты; блочная пороговая обработка; несмещенная оценка риска; асимптотическая нормальность; сильная состоятельность
Интеллектуальный анализ пополняемых коллекций Big Data в режиме процессно-реального времени
- А. А. Грушо Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, grusho@yandex.ru
- М. И. Забежайло Вычислительный центр Федерального исследовательского центра "Информатика и управление" Российской академии наук, m.zabezhailo@yandex.ru
- Д. В. Смирнов ПАО Сбербанк России, dvlsmimov@sberbank.ru
- Е. Е. Тимонина Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, eltimon@yandex.ru
Аннотация: Обсуждается задача поиска релевантных заданной цели данных в постоянно пополняемых
новой информацией коллекциях Big Data в условиях жестких ограничений на допустимое время (так
называемое процессно-реальное время) анализа данных (АД) и поддержки принятия решений (ППР).
В основе развиваемого подхода - использование современных методов искусственного интеллекта,
в частности представления знаний и формализации рассуждений в системах интеллектуального АД
(ИАД). Рассматривается ряд критически значимых для результативности такого ИАД барьеров, в том
числе обусловленных доказуемой трудноразрешимостью возникающих здесь комбинаторных задач, особенностями представления знаний и управления перебором вариантов, а также некоторыми аспектами
управления полнотой и точностью порождаемых результатов. Представлена схема формализации развиваемой процедурной конструкции ИАД. Обсуждаемый подход сопровождается иллюстрациями его
реализации в рамках системы идентификации признаков вредоносной инсайдерской активности в крупном отечественном коммерческом банке.
Ключевые слова: Big Data; процессно-реальное время; интеллектуальный анализ данных; информационная безопасность; поиск инсайдеров
Некоторые свойства смесей нормальных распределений и их приложения к задачам магнитоэнцефалографии
- М. Б. Гончаренко АО Интел, goncharenko.mir@yandex.ru
- Т. В. Захарова Московский государственный университет имени М. В. Ломоносова, факультет вычислительной математики и кибернетики; Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, tvzaharova@mail.ru
Аннотация: Рассматриваются различные свойства общих смесей вероятностных распределений. Особое внимание уделено случаю, когда смешиваемое распределение является нормальным. Установлены сходства в поведении нормальных смесей и нормальных распределений при трансформациях. Рассмотрено приложение к задачам исследования головного мозга методом магнитоэнцефалографии (МЭГ). Определены условия, при которых применима оценка Эйткена (обобщенного метода наименьших квадратов) для поиска источников нейрофизиологической активности в случае, когда распределение шума является нормальной смесью общего вида.
Ключевые слова: смеси распределений; смеси нормальных распределений; смеси распределений Стьюдента; смеси логнормальных распределений; смеси гамма-распределений; магнитоэнцефалография; МЭГ; обратная задача МЭГ; оценка Эйткена
Мягкие вычисления в задачах медицинской диагностики
- М. П. Кривенко Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, mkrivenko@ipiran.ru
Аннотация: В последние годы возрастает значение информатики для интерпретации и анализа данных с использованием вычислительных методов, в частности так называемых "мягких" вычислений (Soft Computing, SC). Рассматриваются возможности применения SC для решения проблем, связанных с медициной, и в особенности в задачах поддержки принятия решений. При этом демонстрируется, что не следует искусственно задействовать новации, тем более что ценой небольших усилий можно обратиться к классическим подходам, методологически строгим и приводящим к гарантированным результатам. Несомненный интерес к методологиям SC в различных дисциплинах (генетика, физиология, радиология, кардиология, неврология и т.д.) показывает, что их изучение крайне плодотворно, и ожидается, что будущие исследования в медицине будут использовать соответствующие методы в большей степени, чем сегодня, и для решения более сложных задач.
Ключевые слова: медицина; мягкие вычисления; референсные значения; байесовский подход
Метод выпрямления искаженных из-за мультиколлинеарности коэффициентов в регрессионных моделях
- М. П. Базилевский Иркутский государственный университет путей сообщения, кафедра математики, mik2178@yandex.ru
Аннотация: При построении регрессионной модели из-за сильной мультиколлинеарности объясняющих переменных происходит искажение ее коэффициентов, в частности их знаков, что негативно сказывается на интерпретационных качествах такой регрессии. Статья посвящена разработке метода выпрямления искаженных из-за мультиколлинеарности коэффициентов. В основе этого метода лежит свойство, которым обладаютранее предложенные автором модели полносвязной линейной регрессии. Исследована нелинейная система, по которой осуществляется оценивание полносвязных регрессий. Показано, что решение этой системы может быть получено численно с помощью метода простых итераций. Предложен способ выбора неизвестных лямбда-параметров в полносвязной регрессии. Установлено, что в многофакторных полносвязных моделях при сильной корреляции всех факторов знаки коэффициентов при переменных во вторичном уравнении совпадают с соответствующими знаками коэффициентов корреляции. Для выпрямления искаженных коэффициентов на основе проведенного исследования разработан алгоритм "Selection B". Разработанный метод выпрямления успешно продемонстрирован на примере моделирования валового внутреннего продукта (ВВП) России.
Ключевые слова: регрессионный анализ; модель полносвязной линейной регрессии; мультиколлинеарность; интерпретация; численный метод; ВВП России
Согласование целей агентов сплоченных гибридных интеллектуальных многоагентных систем
- И. А. Кириков Калининградский филиал Федерального исследовательского центра "Информатика и управление" Российской академии наук, baltbipiran@mail.ru
- С. В. Листопад Калининградский филиал Федерального исследовательского центра "Информатика и управление" Российской академии наук, ser-list-post@yandex.ru
Аннотация: При разработке интеллектуальной системы как сообщества разнородных интеллектуальных агентов важна организация их взаимодействия. Для снижения трудоемкости этой процедуры предлагается методами сплоченных гибридных интеллектуальных многоагентных систем (СГИМАС) моделировать механизмы возникновения сплоченности в коллективах специалистов, решающих проблемы "за круглым столом". Агенты таких систем должны быть способны самостоятельно согласовывать цели, модели предметной области и вырабатывать протокол для решения поставленной проблемы. В статье предлагается модель согласования целей агентов СГИМАС.
Ключевые слова: сплоченность; гибридная интеллектуальная многоагентная система; коллектив специалистов
Разложения Чебышёва–Эджворта для распределений обобщенных статистик типа Хотеллинга, построенных по выборкам случайного размера
- М. М. Монахов Московский центр фундаментальной и прикладной математики Московского государственного университета имени М. В. Ломоносова, mih_monah@mail.ru
Аннотация: Доказан аналог теоремы переноса для функций распределения статистики типа Хотеллинга, размер которой является случайной величиной, позволяющий оценить скорость сходимости разложения Чебышёва-Эджворта и получить явный вид вышеупомянутого разложения для исходной статистики. На основании следствия к доказанному аналогу теоремы переноса для случая, когда размер статистики имеет отрицательное биномиальное распределение (смещенное на 1), получен явный вид разложения Чебышёва-Эджворта второго порядка на базе предельного F-распределения. По построенному разложению Чебышёва-Эджворта для специального значения параметра случайного размера выборки построено разложение Корниша-Фишера второго порядка на базе квантилей F-распределения. Проведен вычислительный эксперимент и построены графики, иллюстрирующие полученное разложение Чебышёва-Эджворта.
Ключевые слова: обобщенные разложения Чебышёва-Эджворта; разложения Корниша-Фишера; выборка случайного объема; F-распределение; статистика типа Хотеллинга
Алгоритмы сжатия данных массивов силовых кривых I: кодирование ошибок предсказания
- Д. В. Сушко Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, dsushko@ipiran.ru
Аннотация: Рассмотрена задача обратимого (без потерь) сжатия данных массивов силовых кривых - трехмерных массивов, элементы которых суть 16-битные целые числа. Такие массивы являются результатом сканирования микрообъектов на атомно-силовом микроскопе (АСМ) в режиме измерения силовых карт. Предложены алгоритмы обратимого сжатия массивов силовых кривых, основанные на универсальном арифметическом кодировании ошибок их предсказания. Применены два метода универсального кодирования. Первый основан на использовании статистической модели источника с вычислимой последовательностью состояний и предполагает разложение всей последовательности ошибок предсказания на две независимо кодируемые подпоследовательности. Второй предполагает выбор подходящего веса при построении используемых в арифметическом кодировании кодовых вероятностей. Для предложенных алгоритмов на пяти тестовых массивах построены оценки скорости кодирования. Результаты показывают, что использование комбинации упомянутых выше методов универсального кодирования позволяет заметно уменьшить скорость кодирования. Скорости кодирования тестовых массивов наиболее эффективным алгоритмом среди предложенных практически применимых алгоритмов составили 3,9285, 3,5268, 3,5024, 4,2813 и 4,2246 бит/пиксель.
Ключевые слова: атомно-силовой микроскоп; массив силовых кривых; обратимое сжатие; арифметическое кодирование; универсальное кодирование
Принципы структуризации статей в электронных словарях
- А. А. Гончаров Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, a.gonch48@gmail.com
- И. М. Зацман Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, izatsman@yandex.ru
Аннотация: Рассмотрены две задачи, возникающие при переводе бумажных словарей в электронную форму представления: (1) структуризация унаследованных и существующих в бумажной форме словарных статей, обеспечивающая расширение функциональных возможностей электронного словаря по сравнению с бумажным; (2) замена традиционных способов шрифтового выделения структурных элементов словарной статьи на способы, обеспечивающие их программную адресацию в базе данных. Показано, что структуру словарных статей, используемую в традиционной лексикографии, необходимо детализировать и одновременно с этим категоризировать часть структурных элементов для расширения функциональных возможностей электронного словаря. Описан подход к формированию классификационной системы, интегрированной в электронный словарь, и последующей рубрикации структурных элементов словарных статей на ее основе. Предлагаемые решения позволяют значительно расширить функционал электронного словаря по сравнению с его бумажным аналогом и преодолеть ограничения традиционной лексикографии, обусловленные бумажной формой представления.
Ключевые слова: принципы структуризации; электронный словарь; электронная лексикография; классификационная система
Извлечение знаний о средствах выражения логико-семантических отношений при помощи надкорпусной базы данных
- А. А. Гончаров Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, a.gonch48@gmail.com
- О. Ю. Инькова Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, olyainkova@yandex.ru
Аннотация: Цель статьи - показать продуктивность использования параллельных текстов и их аннотирования в надкорпусной базе данных (НБД) коннекторов для извлечения знаний об альтернативных средствах выражения логико-семантических отношений (ЛСО). На примере наиболее известных дискур- сивно аннотированных корпусов - Penn Discourse Treebank (PDTB), Prague Dependency Treebank (PDT) и Rhetorical Structure Theory Discourse Treebank (RST-DT) - авторы показывают, что в существующих исследованиях нет консенсуса относительно того, какие языковые средства относить к классу коннекторов (прототипических показателей ЛСО), а какие - к альтернативным средствам. В исследовании продемонстрировано, что применение сопоставительного метода и использование возможностей НБД коннекторов позволяет не только извлекать новое знание о средствах выражения ЛСО в изучаемых языках, но и создавать тезаурусы таких средств, в том числе альтернативных коннекторам. Кроме того, информация, хранящаяся в НБД, дает возможность получать новые знания о том, какие ЛСО могут быть выражены неспециализированными средствами и какова частотность использования этих средств для каждого ЛСО в каждом из изучаемых языков.
Ключевые слова: надкорпусная база данных; логико-семантические отношения; коннекторы; извлечение новых знаний; параллельные тексты
Методы оценки качества машинного перевода: современное состояние
- В. А. Нуриев Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, nurieff.v@gmaii.com
- А. Ю. Егорова Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, ann.shurova@gmail.com
Аннотация: Представлен обзор современных методов оценки качества машинного перевода (МП). В основе этих методов лежат два подхода - автоматический и экспертный. Автоматическая оценка построена на сопоставлении с референтным (профессиональным/эталонным) переводом (РП). Экспертная (с привлечением человека-эксперта) учитывает в первую очередь функциональность: качество перевода оценивается в прагматико-функциональном аспекте, т. е. принимается во внимание, насколько полученный перевод справляется со своими задачами. В первой части статьи рассматривается ряд метрик, используемых для автоматической оценки МП, отмечаются их недостатки и описываются новые направления в их разработке. Вторая часть статьи сфокусирована на экспертной оценке МП. Здесь приведены несколько основных способов такой оценки: оценивание в соответствии с критериями точности и естественности, ранжирование переводов, прямое оценивание, оценка с учетом коэффициента редактирования перевода человеком, аннотирование перевода с применением типологии ошибок.
Ключевые слова: машинный перевод; качество перевода; оценка качества машинного перевода; автоматические метрики; прямое оценивание; типология ошибок машинного перевода
Стохастическая динамика самоорганизующихся социальных систем с памятью (электоральные процессы)
- А. С. Сигов МИРЭА—Российский технологический университет (РТУ МИРЭА), sigov@mirea.ru
- Е. Г. Андрианова МИРЭА—Российский технологический университет (РТУ МИРЭА), andrianova@mirea.ru
- Л. А. Истратов МИРЭА—Российский технологический университет (РТУ МИРЭА), istratov@mirea.ru
Аннотация: Обсуждаются вопросы применения методологии и подходов теоретической информатики для анализа и моделирования социальных групповых процессов. Обработка социологических данных электоральной кампании выборов президента США в 2016 г. позволила построить гистограммы плотности вероятности амплитуд отклонений предпочтений избирателей в зависимости от величины интервала времени их определения и разработать модель описания стохастических социальных процессов с учетом самоорганизации и наличия памяти, учитывающую основные характеристики наблюдаемых процессов. При создании модели рассмотрены схемы вероятностей переходов между возможными состояниями социальной системы и выведено нелинейное дифференциальное уравнение второго порядка. Сформулирована и решена граничная задача для определения функции плотности вероятности амплитуды отклонений предпочтений избирателей в зависимости от величины интервала времени ее определения. Дифференциальное уравнение модели содержит член, отвечающий за возможность самоорганизации, а также учитывает наличие памяти. Возможность возникновения осцилляций определяется начальными условиями. Разработанную модель можно использовать для анализа электоральных кампаний и принятия решений.
Ключевые слова: функция распределения амплитуд колебаний; стохастическая динамика; самоорганизация; наличие памяти; осцилляции плотности вероятности; электоральные процессы
|
|