Институт проблем информатики Российской Академии наук
Институт проблем информатики Российской Академии наук
Российская Академия наук

Институт проблем информатики Российской Академии наук




«Информатика и ее применения» (Том 10, Выпуск 1, 2016)

Оглавление | Библиография | Об авторах

Аннотации и ключевые слова.

ПРОБЛЕМЫ ДОСТУПА К ДАННЫМ В ИССЛЕДОВАНИЯХ С ИНТЕНСИВНЫМ ИСПОЛЬЗОВАНИЕМ ДАННЫХ В РОССИИ.

  • Л. А. Калиниченко  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук; факультет вычислительной математики и кибернетики Московского государственного университета им. М. В. Ломоносова, leonidandk@gmail.com
  • А. А. Вольнова  Институт космических исследований Российской академии наук, alinusss@gmail.com
  • Е. П. Гордов  Международный исследовательский центр климатоэкологических исследований Института мониторинга климатических и экологических систем Сибирского отделения Российской академии наук, gordov@scert.ru
  • Н. Н. Киселева  Институт металлургии и материаловедения им. А. А. Байкова Российской академии наук, kis@imet.ac.ru
  • Д. А. Ковалева  Институт астрономии Российской академии наук, dana@inasan.ru
  • О. Ю. Малков  Институт астрономии Российской академии наук, malkov@inasan.ru
  • И. Г. Окладников  Международный исследовательский центр климатоэкологических исследований Института мониторинга климатических и экологических систем Сибирского отделения Российской академии наук, igor.okladnikov@gmail.com
  • Н. Л. Подколодный  Центр коллективного пользования "Биоинформатика" Федерального исследовательского центра Институт цитологии и генетики Сибирского отделения Российской академии наук, pnl@bionet.nsc.ru
  • А. С. Позаненко  Институт космических исследований Российской академии наук, apozanen@iki.rssi.ru
  • Н. В. Пономарева  Научный центр неврологии, ponomare@yandex.ru
  • С. А. Ступников   Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, sstupnikov@ipiran.ru
  • А. З. Фазлиев  Центр интегрированных информационных систем Института оптики атмосферы Сибирского отделения Российской академии наук, faz@iao.ru

Аннотация: Целью данного обзора является анализ глобальных тенденций создания массивных коллекций данных в мире и обеспечения возможности совместного использования таких коллекций при решении задач исследования и принятия решений в различных областях с интенсивным использованием данных (ОИИД) в России. Конкретный набор ОИИД, отобранный для обзора, включает астрономию, материаловедение, науки о Земле, геномику и протеомику, нейронауку. По каждой из рассмотренных ОИИД представлены крупные стратегические инициативы США и ЕС, примеры крупных коллекций данных в мире до 2025 г., известные проекты информационных и телекоммуникационных инфраструктур и центров данных. Включенный в обзор набор массивных коллекций данных, планируемых к получению в мире, предлагается использовать в качестве ориентира при планировании и развитии исследовательских инфраструктур для накопления и анализа данных, совместимых с зарубежными открытыми инфраструктурами в науке. В частности, рассматриваемые в обзоре коллекции данных, цели их создания и научные исследования, планируемые к осуществлению с их помощью, позволяют перейти к постановке и решению задач создания компонентов перспективных информационных и телекоммуникационных инфраструктур, таких как, например, средства концептуализации ОИИД, необходимые метамодели, средства обеспечения возможности повторного использования коллекций данных, воспроизводимости программ и потоков работ и др.

Ключевые слова: 4-я парадигма; области с интенсивным использованием данных; исследовательские инфраструктуры; коллекции данных; большие данные

АНАЛИЗ СИСТЕМНОГО РИСКА СОВМЕСТНОГО КРЕДИТОВАНИЯ НАД НЕОДНОРОДНЫМИ КОЛЛЕКЦИЯМИ ДАННЫХ.

  • С. А. Ступников  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, sstupnikov@ipiran.ru
  • Д. О. Брюхов  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, brd@ipi.ac.ru
  • Н. А. Скворцов   Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, nskv@ipi.ac.ru

Аннотация: Рассматривается подход к решению задачи анализа системного риска совместного кредитования в области финансового макромоделирования - одной из областей с интенсивным использованием данных - над неоднородными коллекциями данных в виртуально-материализованной среде интеграции. Виртуальная интеграция в среде осуществляется с использованием технологии предметных посредников. Материализованная интеграция реализуется с использованием свободно распространяемой платформы распределенного хранения и обработки данных Hadoop, а также системы Hive, предназначенной для организации реляционных хранилищ данных над Hadoop.

Ключевые слова: системный риск совместного кредитования; решение задач; интеграция данных; неоднородные коллекции данных

ОРТОГОНАЛЬНЫЕ СУБОПТИМАЛЬНЫЕ ФИЛЬТРЫ ДЛЯ НЕЛИНЕЙНЫХ СТОХАСТИЧЕСКИХ СИСТЕМ НА МНОГООБРАЗИЯХ .

  • И. Н. Синицын  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, sinitsm@dol.ru

Аннотация: Для нелинейных дифференциальных стохастических систем на гладких многообразиях с ви- неровскими и пуассоновскими шумами в уравнениях состояния и винеровскими шумами в наблюдениях разработана теория синтеза ортогональных субоптимальных фильтров (ОСОФ) по среднеквадратическому критерию. Получены точные фильтрационные уравнения для стохастических систем на многообразиях (МСтС). Обсуждаются вопросы упрощения точных фильтрационных уравнений. Приводятся уравнения субоптимальных фильтров (СОФ) на основе методов нормальной аппроксимации (МНА) и статистической линеаризации (МСЛ). Для решения задач в реальном времени использование нормальных СОФ (НСОФ) не обеспечивает необходимой точности, поэтому в основу синтеза положены методы ортогональных разложений (МОР) и квазимоментов (МКМ) для апостериорной одномерной плотности. Получены уравнения точности и чувствительности алгоритмов. В качестве тестового примера рассмотрена одномерная нелинейная стохастическая система с аддитивным и мультипликативным белым шумом. Рассмотрены некоторые обобщения разработанных алгоритмов.

Ключевые слова: апостериорное одномерное распределение; винеровский шум; квазимомент (КМ); коэффициент ортогонального разложения (КОР); метод квазимоментов (МКМ); метод ортогональных разложений (МОР); нормальный фильтр; ортогональный СОФ (ОСОФ); первая функция чувствительности; пуассоновский шум; стохастическая система на многообразиях (МСтС); субоптимальный фильтр (СОФ)

АНАЛИТИЧЕСКОЕ МОДЕЛИРОВАНИЕ РАСПРЕДЕЛЕНИЙ В НЕЛИНЕЙНЫХ СТОХАСТИЧЕСКИХ СИСТЕМАХ НА МНОГООБРАЗИЯХ МЕТОДОМ ЭЛЛИПСОИДАЛЬНОЙ АППРОКСИМАЦИИ .

  • И. Н. Синицын  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, sinitsm@dol.ru
  • В. И. Синицын  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, vsmitsin@ipiran.ru

Аннотация: Рассматриваются вопросы оценки точности и чувствительности алгоритмов структурного аналитического моделирования одно- и многомерных распределений методами эллипсоидальной аппроксимации (ЭА) и эллипсоидальной линеаризации (ЭЛ). Разработаны общие алгоритмы эллипсоидального анализа распределений в нелинейных стохастических системах (СтС) на многообразиях (МСтС) с винеровскими и пуассоновскими шумами. Особое внимание уделено алгоритмам для МСтС с аддитивными негауссовскими шумами. Получены уравнения точности и чувствительности к параметрам. В качестве иллюстрации рассмотрена нелинейная двумерная угловая система с аддитивным угловым белым шумом. Составлены уравнения точности и чувствительности, позволяющие оценивать моменты до четвертого порядка включительно. Приведены результаты численных расчетов, показывающие эффективность метода ЭА (ЭЛ) по сравнению с общим методом ортогональных разложений одномерной плотности. Сформулированы некоторые возможные обобщения.

Ключевые слова: метод аналитического моделирования (МАМ); метод эллипсоидальной аппроксимации (МЭА); метод эллипсоидальной линеаризации (МЭЛ); плотность одно- и многомерного распределения; стохастическая система на многообразиях (МСтС); уравнения точности МЭА и МЭЛ; уравнения чувствительности МЭА и МЭЛ

ПРИМЕНЕНИЕ МЕТАПРОГРАММИРОВАНИЯ ДЛЯ ПОВЫШЕНИЯ ТЕХНОЛОГИЧНОСТИ БОЛЬШИХ АВТОМАТИЗИРОВАННЫХ СИСТЕМ.

  • С. П. Ковалёв  Институт проблем управления им. В. А. Трапезникова Российской академии наук, kovalyov@nm.ru

Аннотация: : Предложен подход к снижению затрат на проектирование больших автоматизированных систем за счет привлечения современных технологий метапрограммирования. В качестве наиболее перспективных среди таких технологий рассматриваются разработка, управляемая моделями (model driven engineering, MDE), и аспектно-ориентированный подход (aspect-oriented software development). Представлены методы масштабирования этих технологий, позволяющие эффективно применять их в условиях роста размера создаваемых автоматизированных систем путем замыкания относительно системообразующих структурных отношений. В качестве примера практического применения подхода приводится проектирование математического обеспечения интеллектуальных электроэнергетических сетей. Излагаются принципы математического аппарата для построения, анализа и оптимизации процедур проектирования на базе теории категорий. Описан процесс проектирования генератора расчетных программных компонентов большой автоматизированной системы с применением теоретико-категорных методов.

Ключевые слова: большие автоматизированные системы; метапрограммирование; мегамодель; теория категорий; копредел; разработка, управляемая моделями; аспектно-ориентированный подход; интеллектуальная электроэнергетическая сеть

БАЙЕСОВСКИЕ МОДЕЛИ МАССОВОГО ОБСЛУЖИВАНИЯ И НАДЕЖНОСТИ: АПРИОРНЫЕ РАСПРЕДЕЛЕНИЯ С КОМПАКТНЫМ НОСИТЕЛЕМ.

  • А. А. Кудрявцев  Московский государственный университет им. М.В. Ломоносова, факультет вычислительной математики и кибернетики; Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, nubigena@mail.ru

Аннотация: Данная работа является очередной в серии статей, посвященных изучению байесовских моделей массового обслуживания и надежности. В работе приводятся соотношения для функции распределения и плотности частного р независимых случайных величин, имеющих априорные распределения с компактным носителем, которые интерпретируются как параметр, "препятствующий" функционированию системы, и параметр, "способствующий" функционированию. Описание жизненного цикла многих реальных систем осуществляется в терминах р, например в теории массового обслуживания р называется параметром загрузки системы и входит во многие формулы, описывающие разнообразные характеристики. Рассматриваются частные случаи априорных распределений с компактным носителем, для которых плотности имеют полиномиальный или кусочно-полиномиальный вид.

Ключевые слова: байесовский подход; системы массового обслуживания; надежность; смешанные распределения; распределения с компактным носителем

КОНЦЕПЦИЯ ОНЛАЙН-КОМПЛЕКСА ДЛЯ СТОХАСТИЧЕСКОГО МОДЕЛИРОВАНИЯ РЕАЛЬНЫХ ПРОЦЕССОВ.

  • А. К. Горшенин  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук; Московский технологический университет (МИРЭА), agorshenin@frccsс.rou

Аннотация: Анализ информационных потоков с использованием разнообразных вероятностных моделей достаточно широко распространен в различных прикладных областях. В статье описаны основные принципы построения новой онлайн-системы стохастического моделирования реальных процессов, не имеющей прямых аналогов в силу универсальности предлагаемого набора методов, а также выбранной концепции реализации в виде интернет-ресурса, который позволит конечному пользователю не заботиться о соответствии технических характеристик своего компьютера каким-либо специальным требованиям, а сразу загружать данные на сервер и обрабатывать их.

Ключевые слова: смеси вероятностных распределений; метод скользящего разделения смесей; интеллектуальный анализ данных; онлайн-комплекс; матричные вычисления

РАЗРАБОТКА АЛГОРИТМА ЧИСЛЕННОГО РЕШЕНИЯ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ИНВЕСТИЦИЯМИ В ЗАКРЫТОЙ ДИНАМИЧЕСКОЙ МОДЕЛИ ТРЕХСЕКТОРНОЙ ЭКОНОМИКИ.

  • П. В. Шнурков  НИУ Высшая школа экономики, pshnurkov@hse.ru
  • В. В. Засыпко  НИУ Высшая школа экономики, vzasypko@gmaii.com
  • В. В. Белоусов  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, vbelousov@ipiran.ru
  • А. К. Горшенин  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук; Московский технологический университет (МИРЭА), agorshenin@frccsс.rou

Аннотация: Настоящее исследование посвящено разработке численного метода решения задачи оптимального управления инвестициями в закрытой динамической модели трехсекторной экономики. В предшествующих работах было проведено аналитическое исследование поставленной задачи оптимального управления на основе принципа максимума. В данной работе полученные аналитические представления для функций состояний и сопряженных переменных используются как основа для численного алгоритма. Предлагаемый алгоритм позволяет проанализировать класс допустимых функций управления, имеющих не более заданного конечного числа точек переключения, и найти среди них те, которые удовлетворяют необходимым условиям экстремума и ограничениям исходной задачи. Общая схема предложенного алгоритма может быть использована и при решении других задач оптимального управления, связанных с различными предметными областями. В ходе проведенного исследования разработанный алгоритм реализован в комплексе прикладных программ.

Ключевые слова: модель трехсекторной экономики; принцип максимума Понтрягина; численное решение задачи оптимального управления

МЕЛКОЗЕРНИСТЫЕ ГИБРИДНЫЕ ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ. ЧАСТЬ 2: ДВУНАПРАВЛЕННАЯ ГИБРИДИЗАЦИЯ.

  • И. А. Кириков  Калининградский филиал Федерального исследовательского центра "Информатика и управление" Российской академии наук, baltbipiran@mail.ru
  • А. В. Колесников  Балтийский федеральный университет им. И. Канта; Калининградский филиал Федерального исследовательского центра "Информатика и управление" Российской академии наук, avkolesnikov@yandex.ru
  • С. В. Листопад  Калининградский филиал Федерального исследовательского центра "Информатика и управление" Российской академии наук, ser-list-post@yandex.ru
  • С. Б. Румовская   Калининградский филиал Федерального исследовательского центра "Информатика и управление" Российской академии наук, sophiyabr@gmail.com

Аннотация: Рассматривается проблематика междисциплинарных инструментариев и делается вывод об актуальности исследований свойства "зернистости" гибридов в информатике. Исследованы свойства функциональной и инструментальной неоднородности сложных задач и приведены результаты моделирования мелкозернистых гибридов в теории схем ролевых концептуальных моделей (РКМ). Результаты исследований показаны в рамках лингвистического подхода, суть которого состоит в трансформации вербализованной информации об объектах-оригиналах (сложных задачах) и объектах-прототипах (методах моделирования), имеющейся в полиязыках профессиональной деятельности, в объекты-результаты (функциональные гибридные интеллектуальные системы). Трансформация направляется эвристиками - схемами ролевых концептуальных моделей в неформальной аксиоматической теории. Категориальное ядро теории - "ресурс-свойство-действие-отношение". Введено понятие двунаправленной гибридизации. Рассмотрены ее преимущества и приведены первые результаты.

Ключевые слова: логико-математический интеллект; гибридные интеллектуальные системы; лингвистический подход; теория ролевых концептуальных моделей; мелкозернистые гибриды; двунаправленная гибридизация

ПРЕДСТАВЛЕНИЕ КРОССЯЗЫКОВЫХ ЗНАНИЙ О КОННЕКТОРАХ В НАДКОРПУСНЫХ БАЗАХ ДАННЫХ.

  • И. М. Зацман  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, izatsman@yandex.ru
  • О. Ю. Инькова  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук; Женевский университет, Olga.Inkova@unige.ch
  • М. Г. Кружков  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, magnit75@yandex.ru
  • Н. А. Попкова  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, natasha__popkova@mail.ru

Аннотация: Рассматриваются используемые в контрастивных лингвистических исследованиях базы данных (БД), получившие название "надкорпусных". Они формируются в результате обработки текстов, хранящихся в двуязычных параллельных подкорпусах Национального корпуса русского языка. В них каждому тексту на русском языке соответствует один или несколько его переводов на другой язык, а каждому тексту на иностранном языке - один его перевод на русский язык. Каждый текст на языке оригинала и его переводы выровнены по предложениям. Надкорпусные БД (НБД) представляют собой новый вид лингвистических ресурсов, которые предназначены для целенаправленного извлечения новых знаний о широком спектре языковых единиц (ЯЕ). Эти знания необходимы для повышения качества машинного перевода, актуализации моно- и двуязычных грамматик, а также для обновления многообразных образовательных курсов по лингвистике, теории и практике перевода. В статье дается описание концепции формирования НБД и примера реализации такой базы для представления знаний о коннекторах русского языка и об их переводах на французский язык.

Ключевые слова: : кроссязыковые знания; коннекторы русского языка; представление знаний о коннекторах; надкорпусные базы данных

ПРИМЕНЕНИЕ КОНТЕКСТНО-СВОБОДНЫХ ГРАММАТИК ДЛЯ ИЗВЛЕЧЕНИЯ ОНТОЛОГИИ ИЗ ТЕКСТОВ КОРОТКИХ ОПИСАНИЙ СТАТЕЙ БИОЛОГИЧЕСКОЙ ТЕМАТИКИ.

  • Д. А. Алексеевский  НИУ Высшая школа экономики, dalexeyevsky@hse.ru

Аннотация: Обработка текстов биологической и медицинской тематики представляет интерес как с точки зрения биологии, для которой она предоставляет ценные результаты, так и в качестве источника более сложных задач для обработки текстов. Одной из важных задач автоматической обработки текстов является построение онтологий. Предложен метод построения онтологий промежуточного уровня по корпусу текстов на ограниченном подмножестве английского языка. Онтологии промежуточного уровня служат одним из инструментов решения задачи установления соответствия между фактами в априорных онтологиях и фрагментами текста. Предложен новый подход, основанный на расширенном определении контекстно-свободных (КС) грамматик, позволяющий порождать онтологии, обладающие указанным свойством. Показаны преимущества использования корпусов на ограниченном подмножестве естественного языка для построения таких онтологий.

Ключевые слова: КС-грамматики; построение онтологий; биомедицинские тексты

COMPLEXITY AND ITS INFORMATION CONTENT.

  • N. Callaos  International Institute of Systemic, Cybernetics and Informatics, USA-Venezuela, 2206 Tillman Av., Winter Garden, FL 34787, USA
  • R. Seyful-Mulyukov   Institute of Informatics Problems, Federal Research Center "Computer Science and Control" of the Russian Academy of Sciences, 44-2 Vavilov Str., Moscow 119333, Russian Federation

СЛОЖНОСТЬ И ЕЕ ИНФОРМАЦИОННОЕ СОДЕРЖАНИЕ .

  • Н. К. Каллаос  Международный институт информатики и системных исследований, Орландо, Флорида, США, n.c.callaos@callaos.com
  • Р. Б. Сейфуль-Мулюков  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, rust@ipiran.ru

Аннотация: Термин "информация" имеет разные толкования и определения. Авторы статьи разделяют мнение исследователей, рассматривающих информацию как одно из свойств материи. Такое представление информации использовано для анализа понятий "сложность" и "самоорганизация". Их связь с информацией анализируется на примере закономерностей создания и строения объектов субатомного, микро- и макроуровня. Понятия "сложность", "самоорганизация" и "информационное содержание" применены к нефти, на примере которой доказывается связь этих трех понятий. Анализ нефти как сложной термодинамической природной системы дал возможность расширить понятие "сложность" свойствами и особенностями, которые ранее не рассматривались. Сложность и самоорганизация помогают представить глубинное происхождение и строение углеводородных молекул, возраст, а также образование и возраст нефти в целом.

Ключевые слова: сложность; свойства сложности; сложные системы; самоорганизация; искусственная сложность; природная сложность; сложность углеводородных молекул; происхождение нефти; информационное содержание нефти