|
«Информатика и ее применения» (Том 17, Выпуск 4, 2023)
Оглавление | Об авторах
Нелинейная регуляризация обращения линейных однородных операторов с помощью метода блочной пороговой обработки
- О. В. Шестаков Московский государственный университет им. М. В. Ломоносова, факультет вычислительной математики и кибернетики; Московский центр фундаментальной и прикладной математики; Федеральный исследовательский центр "Информатика и управление" Российской академии наук, oshestakov@cs.msu.ru
- Е. П. Степанов Московский государственный университет им. М. В. Ломоносова, факультет вычислительной математики и кибернетики, estepanov@lvk.cs.msu.ru
Аннотация: Методы пороговой обработки коэффициентов вейвлет-разложений стали популярным инструментом для регуляризации обратных статистических задач благодаря своей простоте, вычислительной эффективности и возможности адаптации как к виду обращаемых операторов, так и к особенностям исследуемой функции. Наиболее плодотворным данный подход оказался при обращении линейных однородных операторов, возникающих в некоторых задачах обработки сигналов и изображений. В работе рассматривается метод блочной пороговой обработки, в котором коэффициенты разложения обрабатываются группами, что позволяет учитывать информацию о соседних коэффициентах. В модели данных с аддитивным гауссовским шумом проводится анализ несмещенной оценки среднеквадратичного риска и показывается, что при определенных условиях данная оценка становится сильно состоятельной и асимптотически нормальной. Данные свойства позволяют строить асимптотические доверительные интервалы для теоретического среднеквадратичного риска рассматриваемого метода.
Ключевые слова: линейный однородный оператор; вейвлеты; блочная пороговая обработка; несмещенная оценка риска; асимптотическая нормальность; сильная состоятельность
Рынок с марковской скачкообразной волатильностью III: алгоритм мониторинга цены риска по дискретным наблюдениям цен активов
- А. В. Борисов Федеральный исследовательский центр "Информатика и управление" Российской академии наук; aborisov@frccsc.ru
Аннотация: Третья часть цикла посвящена задаче оценивания в реальном масштабе рыночной цены риска в финансовой системе, состоящей из банковского депозита, базовых рисковых бумаг и их деривативов. Базовые активы описываются моделью со стохастической волатильностью, представленной скрытым марковским скачкообразным процессом (МСП). Исследуемый рынок предполагается безарбитражным, и рыночная цена риска для него является функцией текущего значения МСП. Таким образом, мониторинг цены риска сводится к задаче фильтрации состояния МСП. Статистическая информация поступает в неслучайные дискретные моменты времени и содержит прямые наблюдения цен базовых активов и косвенные зашумленные наблюдения деривативов. Статья содержит решение задачи оптимальной фильтрации состояния МСП, а также соответствующий численный алгоритм. Представлены результаты вычислительного примера, демонстрирующего качество мониторинга в зависимости от состава и вида доступных наблюдений.
Ключевые слова: рыночная цена риска; безарбитражный рынок; марковский скачкообразный процесс; задача оптимальной фильтрации; численный алгоритм
Процедура построения множества Парето для дифференцируемых критериальных функций
- Я. И. Рабинович Федеральный исследовательский центр "Информатика и управление" Российской академии наук; jacrabin@rambler.ru
Аннотация: Универсальная вычислительная процедура многокритериальной оптимизации позволяет аппроксимировать множество Парето при предъявлении различных требований к вектору частных критериев эффективности и множеству допустимых решений. В настоящей работе предполагается, что частные критерии эффективности псевдовогнуты в открытой окрестности компактного выпуклого множества до- пустимыхрешений, которое может быть задано дифференцируемыми функциональными ограничениями. Для построения на основе универсальной процедуры конкретных численных методов аппроксимации множества Парето предлагается правило выбора начального приближения и правило перехода оттекущего опорного решения к последующему.
Ключевые слова: многокритериальная оптимизация; множество Парето; численные методы аппроксимации; универсальная процедура
Непараметрический алгоритм автоматической классификации данных дистанционного зондирования
- В. П. Тубольцев Сибирский государственный университет науки и технологий им. академика М. Ф. Решетнёва, vitalya.98@mail.ru
- А. В. Лапко Сибирский государственный университет науки и технологий им. академика М. Ф. Решетнёва; Институт вычислительного моделирования Сибирского отделения Российской академии наук, lapko@icm.krasn.ru
- В. А. Лапко Сибирский государственный университет науки и технологий им. академика М. Ф. Решетнёва; Институт вычислительного моделирования Сибирского отделения Российской академии наук, valapko@yandex.ru
Аннотация: Предлагается непараметрический алгоритм автоматической классификации статистических данных большого объема. Эта задача возникает при обработке данных дистанционного зондирования природных объектов. Рассматриваемый алгоритм предполагает сжатие исходной информации на основе декомпозиции многомерного пространства признаков. В результате статистическая выборка большого объема преобразуется в массив данных, составленный из центров многомерных интервалов дискретизации и соответствующих им частот принадлежности случайных величин. Полученная информация используется при синтезе регрессионной оценки плотности вероятности. Под классом понимается компактная группа наблюдений случайной величины, соответствующая одномодальному фрагменту плотности вероятности. На этой основе разрабатывается непараметрический алгоритм автоматической классификации, который основан на последовательной процедуре проверки близости центров многомерных интервалов дискретизации и соотношений между частотами принадлежности случайных величин из исходной выборки этим интервалам. Для повышения вычислительной эффективности предлагаемого алгоритма автоматической классификации используется многопоточный метод его программной реализации. Практическая значимость разработанного алгоритма автоматической классификации подтверждается результатами его применения при оценивании состояния лесных массивов по данным дистанционного зондирования.
Ключевые слова: автоматическая классификация; выборки большого объема; дискретизация области значений случайных величин; регрессионная оценка плотности вероятности; данные дистанционного зондирования
Технология многофакторной классификации математического контента электронной системы обучения
- А. В. Босов Федеральный исследовательский центр "Информатика и управление" Российской академии наук, avbosov@ipiran.ru
- А. В. Иванов Федеральный исследовательский центр "Информатика и управление" Российской академии наук, aivanov@ipiran.ru
Аннотация: Статья продолжает исследование задачи классификации контента электронной обучающей системы (ЭОС). Разработанная ранее технология тематической классификации математического контента, содержащегося в блоках задач и примеров ЭОС, усовершенствована и дополнена новыми функциями.
Для этого использованная ранее модель контента с двумя свойствами - традиционной текстовой форму-лировкой и формульной частью в формате TgX - дополнена рядом дополнительных числовых атрибутов, таких как наличие трансцендентных и производных функций, число формул в задании. Этот блок атрибутов позволил повысить качество имеющегося тематического классификатора и реализовать два новых, а именно: в дополнение к тематической классификации задач реализована возможность автоматического определения, во-первых, сложности задания и, во-вторых, набора компетенций, формируемых у обучаемого заданием. Такая многофакторная классификация представляется важным этапом перспективного направления развития ЭОС - автоматизированного оценивания качества образовательного контента. Проверка работоспособности предлагаемых алгоритмов, обучение классификаторов и анализ качества классификации выполнены по той же дисциплине теории функций комплексного переменного, но на существенно расширенном материале, включая задания для самостоятельной работы студентов - расчетные и экзаменационные работы.
Ключевые слова: электронная обучающая система; математический контент; машинное обучение; многофакторная классификация; оценка качества контента
Расширяемый подход к слиянию данных в распределенных вычислительных средах
- В. В. Сазонтьев Федеральный исследовательский центр "Информатика и управление" Российской академии наук; vladimirsvsite@gmaiJLcom
- С. А. Ступников Федеральный исследовательский центр "Информатика и управление" Российской академии наук; sstupmkov@ipiran.ru
- В. Н. Захаров Федеральный исследовательский центр "Информатика и управление" Российской академии наук; vzakharov@ipiran.ru
Аннотация: Статья относится к области разработки методов и средств интеграции данных. Один из важнейших этапов интеграции данных - это слияние данных, объединение записей, относящихся к одной и той же сущности реального мира, в одну запись с разрешением конфликтов для каждого из атрибутов. Рассмотрена формальная постановка задачи слияния данных, приведен краткий обзор основных существующих групп методов слияния данных. Предложен подход к реализации этапа слияния данных в расширяемой системе интеграции разнородных источников данных в распределенной вычислительной среде, рассмотрена его программная архитектура и основные идеи реализации.
Ключевые слова: слияние данных; распределенные вычислительные среды
Решение задачи оптимального управления запасом непрерывного продукта в стохастической модели регенерации со случайными стоимостными характеристиками
- П. В. Шнурков Национальный исследовательский университет "Высшая школа экономики", pshnurkov@hse.ru
Аннотация: Работа посвящена исследованию проблемы управления запасом определенного непрерывного продукта, эволюция объема которого описывается регенерирующим случайным процессом. Основная особенность рассматриваемой математической модели заключается в том, что стоимостные характеристики, определяющие цену поставки продукта потребителю и затраты, связанные с обеспечением функционирования системы, зависят от случайных внешних факторов. Случайный параметр управления представляет собой время от момента очередного пополнения запаса до момента последующего заказа на пополнение. Доказано, что стационарный стоимостный показатель эффективности управления в рассматриваемой задаче оптимизации по своей аналитической структуре представляет собой дробно-линейный интегральный функционал, зависящий от функции распределения параметра управления. Теоретическое решение задачи оптимизации основано на использовании теоремы об экстремуме дробно-линейных интегральных функционалов.
Ключевые слова: проблема управления запасом непрерывного продукта; случайные стоимостные характеристики системы; управляемые регенерирующие случайные процессы; дробно-линейные интегральные функционалы в задачах стохастического оптимального управления
Границы незавершенной работы в системе с повторными вызовами разных классов и показательным временем обслуживания
- И. В. Пешкова Петрозаводский государственный университет; Институт прикладных математических исследований Карельского научного центра Российской академии наук, iaminova@petrsu.ru
Аннотация: Исследуется односерверная система с повторными вызовами и пуассоновским входным потоком, в которую поступает M классов заявок. Для системы с временами обслуживания, имеющими показательное распределение, получены верхняя и нижняя границы для стационарной незавершенной работы. В качестве нижней границы выступает стационарная незавершенная работа в классической системе M/HM/1 с гиперэкспоненциальным временем обслуживания. Верхней границей служит незавершенная работа в системе, в которой к времени обслуживания добавляется дополнительное время, равное интервалу между попытками попасть на сервер с самой "медленной орбиты". Полученные результаты численного моделирования подтверждают теоретические выводы.
Ключевые слова: система с повторными вызовами; незавершенная работа; стохастическая упорядоченность
Модели совместного обслуживания трафика eMBB и URLLC на основе приоритетов в промышленных развертываниях 5G NR
- Д. В. Иванова Российский университет дружбы народов имени Патриса Лумумбы, ivanova-dv@rudn.ru
- Е. В. Маркова Российский университет дружбы народов имени Патриса Лумумбы, markova-ev@rudn.ru
- С. Я. Шоргин Федеральный исследовательский центр "Информатика и управление" Российской академии наук, sshorgin@ipiran.ru
- Ю. В. Гайдамака Российский университет дружбы народов имени Патриса Лумумбы; Федеральный исследовательский центр "Информатика и управление" Российской академии наук, gaydamaka-yuv@rudn.ru
Аннотация: Технология радиодоступа 5G NR способна осуществлять одновременную поддержку как сверхнадежной доставки с малой задержкой (Ultra-Reliable Low Latency Communication, URLLC), так и расширенного мобильного широкополосного доступа (enhanced Mobile Broadband, eMBB). Из-за критических требований к задержке и надежности, предъявляемых при предоставлении услуг двух классов обслуживания, возникает необходимость введения приоритетов. В статье рассмотрена промышленная среда, в которой производственное оборудование при управлении движением и синхронизации работы генерирует URLLC-трафик, а при удаленном мониторинге - eMBB-трафик. Предложена модель с приоритетным обслуживанием на базовой станции (БС) с прямой связью между устройствами (device- to-device, D2D) и без нее. Полученные численные результаты показывают, что введение приоритетов позволяет эффективно изолировать трафик URLLC и eMBB. При этом стратегия с поддержкой D2D, в которой БС явно резервирует ресурсы для прямой связи, значительно превосходит по показателям качества обслуживания стратегии, в которых явное резервирование не используется, а также стратегию, в которой весь трафик проходит через БС.
Ключевые слова: 5G; NR (New Radio); D2D; URLLC; eMBB; управление ресурсами; приоритетное обслуживание
Модели учета влияния статистических характеристик трафика вычислительных сетей на эффективность прогнозирования средствами машинного обучения
- С. Л. Френкель Федеральный исследовательский центр "Информатика и управление " Российской академии наук, fsergei51 @gmail.com
- В. Н. Захаров Федеральный исследовательский центр "Информатика и управление" Российской академии наук, vzakharov@ipiran.ru
Аннотация: : Статья представляет собой попытку некоторого упорядочения и категоризации огромного потока публикаций по современным методам, техникам и моделям прогнозов данных различной природы с точки зрения их применимости для прогнозирования трафика в вычислительных сетях (ВС). Указанное упорядочение выполняется в рамках предложенной концептуальной модели (КМ) алгоритмов прогнозирования. В рамках этой КМ выделены характеристики как моделей трафика ВС, так и методов управления трафиком, которые явно или неявно могут быть используемы в современных программных инструментах предсказания. Показано, что анализ таких вероятностных аспектов описания данных, как наличие существенной нестационарности, некоторых нелинейных эффектов в моделях данных, а также специфики законов распределения данных, позволяет воздействовать на эффективность обучения предикторов.
Ключевые слова: сетевой трафик; вероятностные модели прогнозирования
Аннотирование параллельных корпусов: подходы и направления развития
- А. А. Гончаров Федеральный исследовательский центр "Информатика и управление" Российской академии наук, a.gonch48@gmail.com
Аннотация: : Представлены возможные направления развития инструментов для аннотирования параллельных корпусов с учетом актуального положения дел в этой сфере. Рассмотрены основные подходы к проведению исследований на корпусном материале - (1) корпусно-ориентированный, (2) корпусноуправляемый и (3) использующий корпус как источник иллюстративного материала - и кратко описаны различия между ними. Показано, что, несмотря на обилие инструментов для аннотирования корпусов, подавляющее большинство из них предназначено для работы с моноязычными корпусами и/или поддерживает очень узкий спектр функций по аннотированию текстовых данных. Наибольшее число функций предоставляют надкорпусные базы данных (НБД) и веб-приложения для доступа к ним, разрабатываемые в ФИЦИУРАН: (1) формирование блоков текста оригинала и перевода, необходимых и достаточных для анализа вхождения изучаемой языковой единицы и варианта ее перевода; (2) выявление вхождения изучаемой языковой единицы и варианта ее перевода; (3) выбор признаков, характеризующих употребление изучаемой языковой единицы и варианта ее перевода; (4) выбор признаков, характеризующих переводное соответствие. Такой спектр функций позволяет решать значительную часть исследовательских задач, однако он может быть расширен. Предлагаются три направления развития имеющегося функционала, способные обеспечить более детализированное описание языкового материала.
Ключевые слова: параллельный корпус; корпусная лингвистика; аннотирование корпуса; лингвистическое аннотирование
Степень семантической близости дискурсивных отношений: методы и инструменты расчета
- О. Ю. Инькова Федеральный исследовательский центр "Информатика и управление" Российской академии наук; Женевский университет, olyainkova@yandex.ru
- М. Г. Кружков Федеральный исследовательский центр "Информатика и управление" Российской академии наук, magnit75@yandex.ru
Аннотация: Рассматриваются методы оценки семантической близости дискурсивных отношений. Авторы предлагают несколько подходов к решению этой проблемы с применением двух информационных ресурсов: коллекции сформированных авторами структурированных определений логико-семантических отношений (ЛСО) и Надкорпусной базы данных коннекторов (НБДК), включающей в себя аннотации переводных соответствий текстовых фрагментов с маркерами ЛСО на русском, французском и итальянском языках. Показано, что при оценке семантической близости ЛСО высокий приоритет будут иметь такие факторы, как принадлежность различительных признаков ЛСО к одному семейству в структурированных определениях отношений, соответствия между показателями различных ЛСО в оригинальных и переводных текстах, а также случаи, когда различные ЛСО выражаются одинаковыми показателями в разных контекстах. Менее значим фактор сочетаемости различных ЛСО в рамках одного и того же контекста. Предполагается, что на основе сформулированных методов станет возможным более точно определить, какие различительные признаки ЛСО имеют наибольший вес при определении их семантической близости.
Ключевые слова: надкорпусная база данных; логико-семантические отношения; коннекторы; аннотирование; фасетная классификация
Научная парадигма информатики: классификация объектов предметной области
- И. М. Зацман Федеральный исследовательский центр "Информатика и управление" Российской академии наук, izatsman@yandex.ru
Аннотация: Дано описание трех верхних уровней классификации объектов предметной области информатики, которая позиционируется как составная часть системы научного знания, охватывающая широкий спектр информационных и компьютерных наук. Границы предметной области при таком позиционировании значительно расширяются и во многом соответствуют концепции полиадического компьютинга Пола Розенблума. В предлагаемой научной парадигме информатики все сущности ее предметной области разделены на два глобальных класса: объекты и их трансформации. Для каждого такого класса в процессе создания парадигмы конструируется своя классификация. С формирования этих классификаций и началось построение парадигмы. В данной статье рассматриваются три верхних уровня классификации объектов предметной области информатики. Основанием для построения первого уровня (самого верхнего) служит предложенное ранее деление предметной области информатики на среды: ментальную, сенсорно воспринимаемую, цифровую и ряд других сред. Основанием для построения второго уровня служит разделение сенсорно воспринимаемых объектов информатики на данные и знаковую информацию как результат преобразования в знаковую форму когнитивных структур человека. Основанием для построения третьего уровня служит типология знаковых систем А. Соломоника. Цель статьи состоит в описании подхода к построению трех верхних уровней классификации объектов информатики и его сопоставлении с ранее использованными подходами к описанию основных сущностей ее предметной области. Также на основе предлагаемого подхода отчасти сформулированы ответы на те вопросы Томаса Куна об основных сущностях предметной области, которые должна содержать парадигма любой науки, а не только информатики.
Ключевые слова: научная парадигма; классификация объектов предметной области информатики; основания классификации; среды предметной области
|
|