Институт проблем информатики Российской Академии наук
Институт проблем информатики Российской Академии наук
Российская Академия наук

Институт проблем информатики Российской Академии наук




«Системы и средства информатики»
Том 25, Выпуск 1, 2015г.

Оглавление | Об авторах

Аннотации и ключевые слова.

МОДЕЛИРОВАНИЕ ГРИД И ОБЛАЧНЫХ СЕРВИСОВ КАК ВАЖНЫЙ ЭТАП ИХ РАЗРАБОТКИ .

  • В. В. Кореньков  Объединенный институт ядерных исследований, korenkov@cv.jinr.ru
  • А. В. Нечаевский  Объединенный институт ядерных исследований, nechav@jinr.ru
  • Г. А. Ососков   Объединенный институт ядерных исследований, ososkov@jinr.ru
  • Д. И. Пряхина   Объединенный институт ядерных исследований, pry-darya@yandex.ru
  • В. В. Трофимов  Объединенный институт ядерных исследований, tvv@jinr.ru
  • А. В. Ужинский   Объединенный институт ядерных исследований, zalexandr@list.ru

Аннотация: Представлена новая система моделирования грид и облачных сервисов, ориентированная на повышение эффективности разработки системы хранения и обработки данных в ВЦ ЛИТ ОИЯИ, входящего в инфраструктуру WLCG в качестве центра уровней Tier 1 и Tier2. Описаны предлагаемые принципы моделирования и их реализация в программном комплексе SyMSim, где реализован подход с учетом качества работы уже функционирующей системы при проектировании ее дальнейшего развития за счет объединения самой программы моделирования с системой мониторинга реального (или модельного) грид-облачного сервиса через специальную базу данных. Приведен пример применения программы для моделирования общей облачной структуры, которая может быть также использована и вне рамок физического эксперимента.

Ключевые слова: имитационная модель; распределенное хранение данных; облачные вычислительные центры; большие данные; оптимизация; мониторинг

КОМБИНИРОВАНИЕ ТЕЗАУРУСНЫХ И КОРПУСНЫХ ЗНАНИЙ ДЛЯ ИЗВЛЕЧЕНИЯ ОЦЕНОЧНЫХ СЛОВ.

  • Н. В. Лукашевич  НИВЦ Московского государственного университета им. М. В. Ломоносова, louk_nat@mail.ru
  • И. И. Четверкин   НИВЦ Московского государственного университета им. М. В. Ломоносова, ilia201@yandex. ru

Аннотация: Описан комбинированный подход к извлечению оценочных слов в заданной предметной области. На первом этапе упорядоченный список оценочных слов извлекается из текстов предметной области на основе методов машинного обучения. На втором этапе полученный список уточняется за счет привлечения лексических знаний, описанных в тезаурусе русского языка. Данная комбинированная модель была обучена на предметной области отзывов о фильмах, а затем была перенесена на другие предметные области. Кроме того, на основе объединения оценочных списков данных предметных областей был получен улучшенный список оценочных слов в широкой области товаров и услуг ProductSentiRus+.

Ключевые слова: анализ тональности текстов; автоматическая обработка текстов; отзывы пользователей; тезаурус русского языка

МНОГОКРИТЕРИАЛЬНЫЙ МЕТОД ВЫЯВЛЕНИЯ НЕЧЕТКИХ ДУБЛИКАТОВ В ПОТОКЕ ТЕКСТОВЫХ СООБЩЕНИЙ.

  • А. М. Андреев  Московский государственный технический университет им. Н. Э. Баумана, arkandreev@gmail.com
  • Д. В. Березкин   Московский государственный технический университет им. Н. Э. Баумана, dmitryb2007@yandex. ru
  • И. А. Козлов  Московский государственный технический университет им. Н. Э. Баумана, kozlovilya89@gmail.com
  • К. В. Симаков   Московский государственный технический университет им. Н.Э. Баумана, skv@ixlab.ru

Аннотация: Рассмотрена задача обнаружения нечетких дубликатов в потоке текстовых сообщений. Предложена модель документа, имеющая возможность гибкой настройки на различные предметные области. Представлен многокритериальный метод выявления дублирующихся документов на основе бинарной классификации с помощью метода опорных векторов. Предложен способ обеспечения высокого быстродействия метода посредством предварительного отбора кандидатов в дубликаты. Проведена экспериментальная оценка предложенного метода, демонстрирующая его практическую применимость.

Ключевые слова:  обнаружение нечетких дубликатов; мера близости; бинарная классификация

ГЕНЕРАЦИЯ ТЕСТОВОГО НАБОРА НА ОСНОВЕ ПОТОКА УПРАВЛЕНИЯ.

  • Н. В. Воинов  Санкт-Петербургский государственный политехнический университет, Voinov@ics2.ecd.spbstu.ru
  • П. Д. Дробинцев   Санкт-Петербургский государственный политехнический университет, drob@ics2.ecd.spbstu.ru
  • В. П. Котляров  Санкт-Петербургский государственный политехнический университет, vpk@ics2.ecd.spbstu. ru
  • И. В. Никифоров  Санкт-Петербургский государственный политехнический университет, igor.nikiforovv@gmail.com
  • И. А. Селин  Санкт-Петербургский государственный политехнический университет, ivanselin93@gmail.com

Аннотация: Статья посвящена подходу к генерации тестового набора в соответствии с широко известными структурными критериями покрытия на основе использования модели потока управления. Подход основан на автоматизированной генерации тестов, использующей символьную верификацию. К отличительным особенностям подхода можно отнести сокращение количества генерируемых тестов за счет учета данных о потоке управления и уменьшение пространства состояний, подлежащих обходу при генерации тестового набора инструментом верификации. В статье представлены основные идеи подхода, описана формальная модель потока управления и инструментальные средства для работы с ней, а также приведены результаты применения подхода в нескольких проектах по разработке промышленного программного обеспечения (ПО).

Ключевые слова: автоматизация тестирования; формальная модель; критерии покрытия

АНАЛИЗ ПОКРЫТИЯ UCM-МОДЕЛИ ТЕСТОВЫМИ СЦЕНАРИЯМИ.

  • Н. В. Воинов  Санкт-Петербургский государственный политехнический университет, Voinov@ics2.ecd.spbstu.ru
  • П. Д. Дробинцев   Санкт-Петербургский государственный политехнический университет, drob@ics2.ecd.spbstu.ru
  • В. П. Котляров  Санкт-Петербургский государственный политехнический университет, vpk@ics2.ecd.spbstu. ru
  • И. В. Никифоров  Санкт-Петербургский государственный политехнический университет, igor.nikiforovv@gmail.com

Аннотация: Рассмотрены подходы к анализу покрытия UCM (Use Case Maps) моделей тестовыми сценариями, сгенерированными по интегральным критериям покрытия. Дан обзор существующих критериев автоматической генерации тестовых сценариев по высокоуровневым UCM-спецификациям. Предложены два подхода анализа покрытия UCM-модели: автоматический, который предоставляет информацию о покрытых и непокрытых элементах, ветвях и путях в сводной форме, и визуальный, который позволяет пользователю наглядно удостовериться в покрытии UCM-модели. Описанные подходы и концепции реализованы в инструменте анализа, который значительно сокращает время формирования покрывающего множества тестов. Дано направление будущих работ по анализу покрытия сигналов UCM-модели.

Ключевые слова: критерии генерации; тестовые сценарии; UCM; спецификации; анализ

ОБОБЩЕННЫЙ ТАБЛИЧНЫЙ LL-АНАЛИЗ.

  • С. В. Григорьев  Санкт-Петербургский государственный университет, Semen.Grigorev@jetbrains.com
  • А. К. Рагозина   Санкт-Петербургский государственный университет, ragozina.anastasiya@gmail.com

Аннотация: Синтаксический анализ является важным шагом анализа кода. Для работы с неоднозначными грамматиками используются обобщенные алгоритмы синтаксического анализа: Generalized LR (GLR) и Generalized LL (GLL). Для работы со встроенными языками - поддержки их в IDE (Integrated Development Environment), анализа в целях реинжиниринга или поиска уязвимостей (SQL-инъекций) - используется абстрактный синтаксический анализ, основанный на классическом табличном анализе. Ранее был предложен алгоритм обобщенного нисходяшего анализа без использования предиктивных таблиц анализа. В данной статье описан подход к созданию табличного GLL-анализатора на основе предложенного алгоритма, который в дальнейшем будет использоваться для получения абстрактного анализатора. Также в статье описан алгоритм обобщенного нисходящего анализа, модификации, которым он подвергся, и результаты сравнения с алгоритмом обобщенного восходящего анализа, который был реализован ранее.

Ключевые слова: синтаксический анализ; GLL; обобщенный анализ; RNGLR; абстрактный анализ; встроенные языки

СИНТЕЗ УСТОЙЧИВЫХ ЛИНЕЙНЫХ ФИЛЬТРОВ И ЭКСТРАПОЛЯТОРОВ ПУГАЧЁВА ДЛЯ СТОХАСТИЧЕСКИХ СИСТЕМ С МУЛЬТИПЛИКАТИВНЫМИ ШИРОКОПОЛОСНЫМИ ШУМАМИ.

  • И. Н. Синицын  'Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, sinitsin@dol.ru
  • Э. Р. Корепанов   Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, ekorepanov@ipiran.ru

Аннотация: Статья посвящена теории аналитического синтеза непрерывных и дискретных равномерно асимптотически устойчивых условно-оптимальных линейных фильтров и экстраполяторов Пугачёва (ЛФП и Л ЭП) для линейных дифференциальных стохастических систем (СтС) с линейными мультипликативными гауссовскими широкополосными шумами, описывающих состояние и наблюдения. Предполагается, что наблюдение входит как в уравнение состояния, так и в уравнение наблюдения. Доказаны теоремы, лежащие в основе алгоритмов синтеза непрерывных устойчивых ЛФП и ЛЭП. Достаточные условия равномерной асимптотической устойчивости сформулированы в виде требований положительной определенности и равномерной стохастической ограниченности некоторых матриц, отражающих свойства наблюдаемости и управляемости. Изложена теория аналитического синтеза непрерывных равномерно асимптотически устойчивых ЛФП и ЛЭП при автокоррелирован- ном широкополосном шуме в наблюдениях. Рассмотрены алгоритмы синтеза дискретных равномерно асимптотически устойчивых ЛФП и ЛЭП как для дискретных, так и для непрерывных СтС с линейными мультипликативными шумами. Приведен иллюстративный пример. Сформулированы некоторые обобщения.

Ключевые слова:  мультипликативный автокоррелированный широкополосный шум; стохастическая система (СтС); точность и устойчивость ЛФП и ЛЭП; уравнение Риккати; условно-оптимальный линейный фильтр и экс- траполятор Пугачёва (ЛФП и ЛЭП)

О СХОДИМОСТИ СЛУЧАЙНЫХ СУММ НЕЗАВИСИМЫХ СЛУЧАЙНЫХ ВЕКТОРОВ К МНОГОМЕРНЫМ ОБОБЩЕННЫМ ДИСПЕРСИОННЫМ ГАММА-РАСПРЕДЕЛЕНИЯМ.

  • А. Ю. Корчагин  Факультет вычислительной математики и кибернетики Московского государственного университета им. М. В. Ломоносова, sasha.korchagin@gmail.com

Аннотация: Цель данной работы - описать условия сходимости распределений сумм случайного числа независимых неодинаково распределенных многомерных случайных величин к многомерным дисперсионно-сдвиговым смесям нормальных законов и, в частности, к многомерным обобщенным гиперболическим или многомерным обобщенным дисперсионным гамма-распределениям (GVG- generalized variance-gamma).

Ключевые слова: случайная сумма; многомерная дисперсионно-сдвиговая смесь нормальных законов; многомерное обобщенное гиперболическое распределение; многомерное обобщенное дисперсионное гамма-распределение; обобщенное обратное гауссовское распределение; обобщенное гамма-распределение

ПРОГНОЗИРОВАНИЕ ОБЪЕМОВ ЖЕЛЕЗНОДОРОЖНЫХ ГРУЗОПЕРЕВОЗОК ПО ПАРАМ ВЕТОК.

  • Р. К. Газизуллина  Московский физико-технический институт, rimma.gazizullina@gmail.com
  • М. М. Стенина  Московский физико-технический институт, mmedvednikova@gmail.com
  • В. В. Стрижов   Вычислительный центр им. А. А. Дородницына РАН, strijov@ccas.ru

Аннотация: Работа посвящена исследованию алгоритма непараметрического прогнозирования объемов железнодорожных грузоперевозок. Решается задача прогнозирования числа вагонов с различными грузами, следующих по различным маршрутам. Задана топология железнодорожной сети - для всех возможных пар железнодорожных веток дана информация о всех блоках вагонов, совершивших переезд с одной ветки на другую, включая число вагонов в блоке, вид груза и дату прохождения маршрута. Для построения прогноза используется алгоритм, основанный на свертке эмпирической плотности распределения значений временного ряда с функцией потерь. Ранее прогноз выполнялся для каждого железнодорожного узла в отдельности. Предлагается повысить качество прогноза за счет прогнозирования по парам веток вместо прогнозирования отправления всех вагонов с данного узла. Алгоритм проиллюстрирован посуточными данными за полтора года о перевозках 38 типов грузов.

Ключевые слова: прогнозирование; непараметрический метод; загруженность железнодорожного узла; функция потерь; эмпирическое распределение; свертка

НЕКОТОРЫЕ ПОДХОДЫ К ФОРМИРОВАНИЮ НОРМАТИВНО-ТЕХНИЧЕСКОЙ БАЗЫ ЕДИНОГО ИНФОРМАЦИОННОГО ПРОСТРАНСТВА РОССИИ В ЧАСТИ ИНФОРМАЦИОННЫХ РЕСУРСОВ.

  • А. А. Зацаринный  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, azatsarinny@ipiran.ru
  • Э. В. Киселев  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, ekiselev @ipiran.ru

Аннотация: В статье развиваются методические подходы к формированию нормативно-технической базы для создания единого информационного пространства Российской Федерации (ЕИП РФ) в части вопросов систематизации и взаимодействия информационных ресурсов (ИР). В составе федерального уровня ЕИП РФ как мегасистемы предлагается создание двух централизованных компонентов с собственными ИР - центра управления (ЦУ) и центра взаимодействия с мировым информационным пространством (ЦВ МИП). Предложена обобщенная модель формирования и взаимодействия защищенных ИР (ЗИР) в составе единого пространства. Изложен общий подход к формированию, взаимодействию и использованию ЗИР на стороне участника мегасистемы. Предложена обобщенная модель участника, включающая общий контур ЗИР, в который входят три самостоятельных контура соответственно для открытых, конфиденциальных и закрытых ИР. Определены некоторые вопросы проектирования профилей сред открытых систем участников в составе единого пространства. Предложена модель процесса создания профиля среды открытой системы для единой информационной системы (ЕИС) участника на базе российского руководства Р 50.1.041-2002.

Ключевые слова: защищенные информационные ресурсы; центр управления ЕИП РФ; центр взаимодействия с мировым информационным пространством; шлюзы безопасного взаимодействия ЕИП РФ; общероссийская система элек-тронного взаимодействия; контуры защищенных информационных ресурсов участника; банк данных участника; архив информации участника; единая информационная (информационно-телекоммуникационная) система участника в защищенном исполнении; проектирование профилей сред для открытых систем участников

ТЕХНОЛОГИЯ ПРЕДОТВРАЩЕНИЯ ДУБЛИРОВАНИЯ БИБЛИОГРАФИЧЕСКИХ ОПИСАНИЙ В БАЗЕ ДАННЫХ НАУЧНЫХ ПУБЛИКАЦИЙ БИАС ИПИ РАН .

  • М. Ю. Заикин  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, maxim@amsd.com
  • В. С. Долгополов  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, slava@amsd.com
  • О. Л. Обухова  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, obihova@amsd.com
  • И. В. Соловьев  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, soloviev@amsd.com

Аннотация: Представлена технология предотвращения дублирования библиографических описаний (БО), разработанная для научной базы данных (БД) библиографической информационно-аналитической системы (БИАС) ИПИ РАН (с февраля 2015 г. - в составе ФИЦ ИУ РАН). Приведен анализ причин, порождающих дублирование записей. Разработанная технология опирается на применение программных модулей определения схожести, использующих методы нечеткого поиска по алгоритму Оливера, и средств визуализации полученных результатов, которые встроены в систему на уровне формирования контента БД. Введено понятие индекса схожести, используемое в алгоритмах поиска дублирующих БО. Представлена формальная модель данных, заложенная в основу построения БД, базирующаяся на принципах фасетной навигации, разработанной авторами. Исследование формальной модели позволило разработать алгоритмы, на которых строилась технология предотвращения дублирования БО. Применение разработанных программных средств дало возможность обнаружить и удалить дублирующие БО в БД научных публикаций БИАС ИПИ РАН.

Ключевые слова: программные модули определения схожести; индекс схожести; метод нечеткого поиска по алгоритму Оливера; фасетная навигация

ПОСТРОЕНИЕ СИСТЕМЫ УПРАВЛЕНИЯ ПОТОКАМИ ПАЦИЕНТОВ.

  • Г. Я. Илюшин  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, ilushin@ipiran.ru
  • В. И. Лиманский  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, vlimansky@ipiran.ru

Аннотация: Рассмотрена организационная модель системы здравоохранения в части оказания населению первичной медицинской помощи и складывающаяся в процессе ее реформирования иерархическая трехуровневая структура лечебно-профилактических учреждений (ЛПУ). Выполнен анализ существующих способов маршрутизации пациентов, включая самозапись пациентов в ЛПУ первого уровня (прикрепляемый контингент), перенаправление пациентов в ЛПУ второго и третьего уровня с помощью выдаваемых врачами талонов и направлений. Представлен анализ преимуществ и недостатков этих способов. Рассмотрены применяемые для маршрутизации пациентов электронные системы управления потоками пациентов и некоторые проблемы их внедрения, в частности внедрение "Единой медицинской информационно-аналитической системы" (ЕМИАС) в г. Москве. Проведен анализ электронных систем управления потоками пациентов (СУПП), выделены их основные компоненты и предложена структура построения такой системы, основанная на принципах единой точки взаимодействия компонентов распределенных систем. Рассмотрены процессы, протекающие в системе при реализации основных прецедентов, и определены потоки данных между компонентами системы, возникающие при исполнении этих процессов. Рассмотрены также подходы к организации электронного документооборота между ЛПУ с использованием электронных направлений.

Ключевые слова: медицинские информационные системы (МИС); системы управления потоками пациентов (СУПП); лечебно-профилактические учреждения (ЛПУ); распределенные информационные системы; диаграммы последовательностей

ИНФОРМАЦИОННЫЕ РЕСУРСЫ КОНТРАСТИВНЫХ ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЙ: ТИПОЛОГИЧЕСКИЕ БАЗЫ ДАННЫХ .

  • М. Г. Кружков  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, magnit75@yandex.ru

Аннотация: Рассматриваются информационные ресурсы, использующиеся в контрастивных лингвистических исследованиях, и их основные характеристики. Основными видами таких информационных ресурсов являются типологические базы данных (ТБД) и электронные корпуса текстов. В рамках данной работы основное внимание уделяется ТБД. Среди ТБД выделяются ТБД широкого профиля и специализированные ТБД. Типологические базы данных широкого профиля (или "характеристические" ТБД) представляют собой универсальные хранилища данных о широком спектре характеристик различных естественных языков; они могут использоваться как справочные инструменты, а также при решении задач, связанных с классификацией языков. Специализированные ТБД используются при детальном исследовании отдельных языковых явлений на примере ограниченных наборов языков: они тщательно моделируют структуру этих явлений и включают примеры, ил-люстрирующие их функционирование в рассматриваемых языках. В статье также уделяется внимание проблемам, связанным с формированием ТБД и интеграцией данных из нескольких ТБД с различной структурой.

Ключевые слова:  контрастивная лингвистика; базы данных; типологические базы данных; электронные корпуса текстов

О ВКЛАДЕ АКАДЕМИКА И. А. МИЗИНА В ТЕОРИЮ И ПРАКТИКУ СОЗДАНИЯ ОТЕЧЕСТВЕННЫХ ИНФОРМАЦИОННО-ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМ: К 80-ЛЕТИЮ СО ДНЯ РОЖДЕНИЯ.

  • И. А. Соколов Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, isokolov@ipiran.ru
  • А. А. Зацаринныи  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, azatsarinny@ipiran.ru
  • В. Н. Захаров  Институт проблем информатики Федерального исследовательского центра "Информатика и управление" Российской академии наук, vzakharov@ipiran.ru

Аннотация: Статья посвящена 80-летнему юбилею академика И. А. Мизина, директора ИПИ РАН в период 1989-1999 гг., выдающегося ученого, конструктора и инженера. Дана краткая биографическая справка, характеризующая научно-практическую деятельность И. А. Мизина. Вклад академика И. А. Мизина в теорию и практику создания отечественных информационно-телекоммуникационных сетей рассматривается применительно к трем направлениям его деятельности. Первое - разработка и внедрение системы обмена данными (СОД) в интересах автоматизированных систем управления (АСУ) Вооруженных Сил, первой отечественной сети с пакетной коммутацией. Второе направление - обоснование информационных технологий для создания крупных территориальных систем передачи данных в регионах России. Третье направление - создание и развитие информационных сетей в интересах органов государственной власти с учетом требований по защите информации.

Ключевые слова: главный конструктор; академик; информационно-телеком-муникационные сети; информационные технологии; система обмена данными; пакетная коммутация; методы передачи информации; защита информации; каналы связи; испытания; органы государственной власти