|
«Системы и средства информатики» Том 33, Выпуск 1, 2023г.
Оглавление | Об авторах
Аннотации и ключевые слова.
Самосинхронный конвейер с переменным числом ступеней
- И. А. Соколов Федеральный исследовательский центр "Информатика и управление" Российской академии наук, ISokolov@ipiran.ru
- Ю. А. Степченков Федеральный исследовательский центр "Информатика и управление" Российской академии наук, YStepchenkov@ipiran.ru
- Ю. Г. Дьяченко Федеральный исследовательский центр "Информатика и управление" Российской академии наук, diaura@mail.ru
- Н. В. Морозов Федеральный исследовательский центр "Информатика и управление" Российской академии наук, NMorozov@ipiran.ru
- Д. Ю. Дьяченко Федеральный исследовательский центр "Информатика и управление" Российской академии наук, diaden87@gmail.com
Аннотация: Рассматривается проблема увеличения производительности са- мосинхронных схем (СС). Эффективным способом повышения производительности, как и в синхронных схемах, оказалось использование конвейера для реализации многоступенчатой обработки входных данных. Анализируются возможные варианты динамического сокращения числа активно работающих ступеней при выполнении некоторых условий, определяемых значением обрабатываемых данных или внешним сигналом. Приведенные оценки показывают, что эффективность использования опционально варьируемого числа ступеней конвейера зависит от числа маскируемых ступеней и вероятности появления события, разрешающего такое маскирование. В частности, замена двух последовательных ступеней конвейера одной параллельной ступенью становится целесообразной, если она реализуется не менее чем в 63% операций обработки данных, а обход двух и более ступеней уменьшает среднюю латентность конвейера, если он срабатывает не менее чем в 43% операций.
Ключевые слова: самосинхронная схема; конвейер; обход; мультиплексирование; латентность; производительность
Корпусные данные при контрастивном изучении пунктуации
- В. А. Нуриев Федеральный исследовательский центр "Информатика и управление" Российской академии наук, nurieff.v@gmail.com
- М. Г. Кружков Федеральный исследовательский центр "Информатика и управление" Российской академии наук, magnit75@yandex.ru
Аннотация: Рассматриваются возможности использования корпусных данных при контрастивном исследовании пунктуации. Пунктуационные системы разных языков не всегда совпадают. В таких случаях пунктуационное оформление исходного (ИТ) и переводного текстов (ПТ) не может быть одинаковым. Проблемы межъязыковой пунктуационной асимметрии изучает контрастивная пунктуация - малоразработанная область лингвистики. Переводчику необходимо иметь четкое представление об этих межъязыковых расхождениях, чтобы оценить, насколько индивидуализирована пунктуационная манера в ИТ, и понять, как ее представить в ПТ. Для этого он может использовать различные информационные ресурсы, которые создаются в рамках информатики, компьютерной лингвистики и корпусного переводоведения. Один из таких ресурсов - надкорпусные базы данных (НБД), разрабатываемые в Федеральном исследовательском центре "Информатика и управление" Российской академии наук, позволяющие обрабатывать широкий массив параллельных текстов на разных языках и собирать эмпирические данные. Показано, как этот информационный ресурс можно использовать для контрастивного изучения пунктуации. В качестве иллюстративного материала привлекаются данные по нескольким пунктуационным знакам в русском и французском языке.
Ключевые слова: пунктуация; контрастивные исследования; перевод; художественный перевод; межъязыковая асимметрия; корпусное переводоведение; надкорпусная база данных; параллельный корпус; французский язык; русский язык
Интеграционные возможности надкорпусных баз данных
- А. А. Дурново Федеральный исследовательский центр "Информатика и управление" Российской академии наук, duralex49@mail.ru
- О. Ю. Инькова Федеральный исследовательский центр "Информатика и управление" Российской академии наук; Женевский университет, olyainkova@yandex.ru
- В. А. Нуриев Федеральный исследовательский центр "Информатика и управление" Российской академии наук, nurieff.v@gmail.com
Аннотация: Описываются интеграционные возможности надкорпусных баз данных, разработанных в фИЦ ИУ РАН. Продемонстрировано, как три базы данных - Надкорпусная база данных иерархии логико-семантических отношений (НБДИ ЛСО), База данных параллельных текстов (БДТ) и Надкорпусная база данных коннекторов (НБДК) - интегрированы между собой. Информационная система иерархии логико-семантических отношений (ИСИЛСО) использует специально спроектированную базу данных (НБДИ ЛСО), в которой аннотации логико-семантических отношений представлены в виде деревьев, т.е. ориентированных связных ациклических графов, где узлы содержат данные, а ребра отображают отношение подчиненности между узлами. Наряду с НБДИ ЛСО ИСИЛСО использует данные из БДТ и НБДК. Такая интеграция позволяет комбинировать методологические наработки информатики, контрастивной и корпусной лингвистики, теории и практики перевода, не упуская из виду факторы, которые могут отрицательно сказаться на валидности и надежности конечных данных.
Ключевые слова: надкорпусная база данных; интеграция баз данных; многоязычный корпус; параллельный корпус; корпусные информационные ресурсы; переводоведение; контрастивная лингвистика; машинный перевод
Использование базы данных моделей структурных переводческих трансформаций для извлечения многокомпонентных терминологических единиц
- Ю. И. Бутенко Московский государственный технический университет им. Н. Э. Баумана, iubutenko@bmstu. ru
Аннотация: Раскрыты основные принципы использования базы данных моделей структурных переводческих трансформаций терминологических словосочетаний для извлечения и выравнивания многокомпонентных терминов из англо- и русскоязычных параллельных текстов. Описана формальная структура терминологических единиц, а также структурные модели многокомпонентных терминов в английском и русском языках. Дано определение структурных трансформаций в переводе, выделены основные модели структурных трансформаций англо- и русскоязычных терминов при переводе научно-технических текстов. Обосновано, что использование структурных переводческих моделей терминологических словосочетаний требует учета специфических особенностей каждого анализируемого языка. Предложен подход к извлечению и выравниванию терминологических единиц в параллельных научно-технических текстах, а каждый этап предложенного подхода проиллюстрирован примерами обработки параллельного научно-технического текста на русском и английском языках.
Ключевые слова: структурная модель; многокомпонентный термин; формальная структура термина; модели структурных переводческих трансформаций; русскоязычная терминология; англоязычная терминология
Семантические интерпретации высоких нормальных форм отношений реляционной базы данных
- В. А. Иванов Российский технологический университет- МИРЭА, iva.mac@mail.ru
- М. Ю. Конышев Финансовый университет при Правительстве РФ, mykonyshev@fa.ru
- С. В. Смирнов Российский технологический университет- МИРЭА, smimov_s@mirea.ru
- О. В. Тараканов Российский технологический университет- МИРЭА, ole_g66@list.ru
- В. О. Тараканова Федеральная служба охраны РФ, talero@list.ru
- С. В. Усовик Российский технологический университет- МИРЭА, usovik@mirea.ru
Аннотация: Приведены результаты семантического моделирования процессов устранения избыточности и защиты отношения реляционной базы данных (БД) от аномалий обновления за счет совершенствования процесса его нормализации. Установлены семантические эквиваленты требований нормальных форм реляционного отношения, повышающие результативность алгоритма нормализации. Сформулирована и доказана теорема, гарантирующая однозначную детерминацию функциональной зависимости (ФЗ) атрибута от потенциального ключа. Сформулированы уточнения алгоритма нормализации реляционного отношения. Приведены способы применения предложенных интерпретаций. Показаны практически применимые процедуры, снимающие противоречия проектирования рациональной структуры БД. Основные выводы сформулированы в отношении фактографических БД. Предложенные механизмы не зависят от используемой системы управления БД.
Ключевые слова: реляционная база данных; нормализация отношения; потенциальный ключ; неключевой атрибут; функциональная зависимость; многозначная зависимость
Задача классификации в условиях искаженных причинно-следственных связей
- А. А. Грушо Федеральный исследовательский центр "Информатика и управление" Российской академии наук, grusho@yandex.ru
- Н. А. Грушо Федеральный исследовательский центр "Информатика и управление" Российской академии наук, info@itake.ru
- М. И. Забежайло Федеральный исследовательский центр "Информатика и управление" Российской академии наук, m.zabezhailo@yandex.ru
- А. А. Зацаринный Федеральный исследовательский центр "Информатика и управление" Российской академии наук, AZatsarinny@ipiran.ru
- Е. Е. Тимонина Федеральный исследовательский центр "Информатика и управление" Российской академии наук, eltimon@yandex.ru
- С. Я. Шоргин Федеральный исследовательский центр "Информатика и управление" Российской академии наук, sshorgin@ipiran.ru
Аннотация: Рассматривается модель классификации потока объектов на предмет наличия или отсутствия в каждом объекте O некоторого свойства A. Предполагается, что существуют M взаимно однозначных преобразований объектов, поступающих на классификацию, и в потоке встречаются объекты, полученные из O по одному из этих преобразований. Для объекта O известно, что в нем содержится свойство A, которое послужило причиной появления известных объектов Bi, B2,..., Bk в информационных пространствах Ii ,l2,...,Ik o Это означает, что выявить свойство A можно только наблюдая следствия Bi, B2,..., Bk. Задача заключается в том, что для каждого приходящего в потоке объекта необходимо определить присутствие или отсутствие в нем преобразованной причины A. Построены алгоритмы проверки такой возможности в случаях, когда есть описание характеристик A и когда такое описание отсутствует.
Ключевые слова: задача конечной классификации; причинно-следственные связи; машинное обучение в условиях искажений
Методы классификации пользователей СДО в модели построения их индивидуальной траектории обучения
- Я. Г. Мартюшова Московский авиационный институт, ma1554@mail.ru
- Т. А. Минеева Московский авиационный институт, mineeva.t2015@gmail.com
- А. В. Наумов Московский авиационный институт, naumovav@mail.ru
Аннотация: Исследуется проблема адаптации системы дистанционного обучения (СДО) под контингент пользователей путем формирования индивидуальных траекторий обучения на основе результатов их промежуточных тестирований. Важнейшая составляющая предлагаемой модели - классификация пользователей на основе теста по различным категориям успеваемости. Проводится сравнительный анализ результатов применения для этой цели различных классификаторов, таких как байесовский классификатор, логистическая регрессия, метод k-ближайших соседей (KNN), дерево решений, метод случайного леса, градиентный бустинг, а также классификатора, использующего композицию нескольких различных алгоритмов (метод бутстреп-агрегирова- ния, или бэггинг) из названных выше для предсказания категории пользователя по принципу простого большинства. Приводятся результаты численного эксперимента с использованием данных функционирования системы дистанционного обучения МАИ CLASS.NET.
Ключевые слова: система дистанционного обучения; методы машинного обучения; адаптивные системы; индивидуальная траектория обучения
Эффективные вычисления при факторизации матричных данных с пропусками
- М. П. Кривенко Федеральный исследовательский центр "Информатика и управление" Российской академии наук, mkrivenko@ipiran.ru
Аннотация: Работа посвящена эффективной реализации факторизации матрицы с отсутствующими компонентами в произведение двух матриц более низкого ранга. Задача оценивания параметров принятой модели данных решается путем многомерной оптимизации. Большие размеры матриц и векторов, входящих в итерационные алгоритмы, порождают на практике проклятие размерности. Предлагается кардинально снизить сложность матричных операций путем представления их в блочно-диагональном виде. Обосновывается возможность приведения обрабатываемых матриц к блочно-диагональному виду, описываются правила поблочного сингулярного разложения матриц. Преимущества поблочной обработки иллюстрируются на примере факторизации матрицы данных различных размеров и с различными вероятностями пропуска компонент. Время оценивания параметров может сокращаться на несколько порядков по сравнению с обработкой матриц в обычном представлении.
Ключевые слова: понижающая ранг аппроксимация матрицы; сингулярное разложение; пропущенные данные; ALS-алгоритм; блочно-диагональное представление матрицы
Об оценках устойчивости и их применении для некоторых моделей массового обслуживания
- И. А. Ковалёв Вологодский государственный университет; Московский центр фундаментальной и прикладной математики, kovalev.iv96@yandex.ru
Аннотация: Рассматриваются модели обслуживания, описываемые марковскими цепями с непрерывным временем. В статье применен один из методов, используемых для изучения устойчивости и получения соответствующих количественных оценок возмущений (неоднородных) цепей Маркова с непрерывным временем и конечным или счетным пространством состояний. Рассматриваются несколько конкретных моделей. Получены оценки устойчивости различных характеристик таких систем. Рассмотрены оценки, которые могут быть полезны для решения задач, связанных с управлением, а именно: с изменением мощности потока требований или мощности сервера, для того чтобы среднее число требований в системе находилось в заданных границах. Рассмотрен численный пример.
Ключевые слова: нестационарные системы обслуживания; марковские модели; оценки устойчивости; системы массового обслуживания; мощность потока; мощность сервера
Программное определение сети в конвергентной и гиперконвергентной инфраструктурах
- В. Б. Егоров Федеральный исследовательский центр "Информатика и управление" Российской академии наук, vegorov@ipiran.ru
Аннотация: В последнее время конвергентная (converged infrastructure, CI) и гиперконвергентная инфраструктуры (hyperconverged infrastructure, HCI) стали предметом широкого обсуждения, но сами эти термины не получили общепринятого определения. В статье делается попытка прояснить роль сети в такого рода инфраструктурах с учетом неопределенности с их трактовкой, а также оценить возможности и перспективы реализации в них сетей на принципах программного определения (software-defined networking, SDN). Основным принципам SDN соответствует такая существенная отличительная особенность CI, как централизованное управление всеми компонентами инфраструктуры с единой консоли. Однако это условие необходимо, но не достаточно, сеть типичной CI можно рассматривать лишь как шаг в направлении SDN. Полноценная реализация концепции SDN становится возможной в HCI, где из-за присущих гиперконвергенции особенностей поставщик фактически вынужден организовать в своей инфраструктуре программно-определяемое хранилище (software-defined storage, SDS) и потенциально обладает возможностью дополнить свой продукт SDN-сетью. Для рядовых владельцев центров обработки данных (ЦОД) покупка гиперконвергентной инфраструктуры может оказаться не только самым простым способом обретения современного SDS, но едва ли не единственно возможным - готовой SDN.
Ключевые слова: гиперконвергентная инфраструктура; конвергентная инфраструктура; программно-определяемые сети; CI; HCI; SDN
Центры компетенции по искусственному интеллекту и Национальная технологическая инициатива
- А. П. Сучков Федеральный исследовательский центр "Информатика и управление" Российской академии наук, ASuchkov@ipiran.ru
Аннотация: Задача достижения технологического суверенитета может быть решена путем консолидации усилий на государственном уровне с выделением приоритетных направлений и задач развития инновационных технологий и определением путей их достижения. В связи с этим автономной некоммерческой организации "Агентство стратегических инициатив по продвижению новых проектов" рекомендовано подготовить стратегический план развития Национальной технологической инициативы (НТИ) на долгосрочный период и предложения по контролю за его соблюдением. В статье рассматриваются вопросы формирования целостной картины совокупности функций и задач НТИ в интересах данного стратегического плана и применительно к проблематике технологий искусственного интеллекта (ИИ).
Ключевые слова: Национальная технологическая инициатива; центры компетенций; технологии искусственного интеллекта
Теория S-символов: концептуальные основания
- В. Д. Ильин Федеральный исследовательский центр "Информатика и управление" Российской академии наук, vdilyin@yandex.ru
Аннотация: Предложенная теория S-символов представляет собой расширенное обобщение теории S-моделирования и рассматривается как часть методологического обеспечения разработок систем искусственного интеллекта в S-среде (включая системы знаний, системы S-моделирования задач и конструирования программ и др.). S-среда, основанная на взаимосвязанных системах S-(символов, кодов, сигналов) служит инфраструктурным основанием реализации информационных технологий (ИТ) различного назначения. В статье представлена первая часть (из четырех) описания теории. Приведено обоснование целесообразности и основные понятия (S-символ, S-код, S-сигнал и др.). Определены виды и типы S-(символов, кодов и сигналов). Введены отношения эквивалентности, порядка и принадлежности, задаваемые на системах S-(символов, кодов и сигналов). Определения сопровождаются примерами.
Ключевые слова: теория S-символов; S-символ; S-код; S-сигнал; S-среда; искусственный интеллект; информационная технология
Механизм формирования гипотез в технологии поддержки конкретно-исторических исследований
- И. М. Адамович Федеральный исследовательский центр "Информатика и управление" Российской академии наук, Adam@amsd.com
- О. И. Волков Федеральный исследовательский центр "Информатика и управление" Российской академии наук, Volkov@amsd.com
Аннотация: Статья продолжает серию работ, посвященных технологии поддержки конкретно-исторических исследований (ПКИИ). Технология построена на принципах сотворчества и краудсорсинга и ориентирована на широкий круг не относящихся к профессиональным историкам и биографам пользователей. Статья посвящена дальнейшему развитию технологии за счет интеграции в нее механизма, позволяющего автоматически определить потенциально перспективные направления исследования. Предлагаемый подход заключается в автоматическом заполнении информационных лакун в наборе фактов, описывающих объект исследования, на базе неполной индукции. Проведен анализ базы для индуктивного обобщения, показаны способы ее формирования. Обоснована возможность использования для этой цели процедуры импутации данных, используемой в задачах анализа данных и машинного обучения. Проанализированы методы импутации данных с точки зрения особенностей технологии и специфики конкретно-исторического исследования. Анализ показал целесообразность построения механизма автоматического формирования гипотезы с опорой на такой метод импутации данных, как метод деревьев классификации на базе алгоритма CHAID (Chi Squared Automatic Interaction Detection).
Ключевые слова: конкретно-историческое исследование; распределенная технология; формирование гипотез; информационная лакуна; импутация даннных
Базисные информационные технологии, информационная война и многомерный иерархический территориальный суверенитет: этапы глобально-космической коэволюции
- С. Н. Гринченко Федеральный исследовательский центр "Информатика и управление" Российской академии наук, sgrinchenko@ipiran.ru
Аннотация: С позиций информатико-кибернетического моделирования процесса развития самоуправляющейся иерархо-сетевой системы Человечества рассмотрен параллелизм процессов глобально-космической коэволюции базисных информационных технологий (БИТ), "многомерного иерархического территориального суверенитета" (МИТС) и информационной войны (ИВ). Периоду формирования субъектами: (1) "дворов"/семей Hominoidea БИТ сигнальных поз/звуков/движений соответствует развитие "пред-пред-суве- ренитета" сообществ этих территорий (семейной особости) и "пред-пред-ИВ пред-пред-обмана противника"; (2) "поселений" Homo erectus БИТ мимика/жесты соответствует развитие "пред-суверенитета" сообществ этих территорий (родовой особости) и "пред-ИВ пред-обмана противника"; (3) "округ" Homo sapiens-1 БИТ речи/языка соответствует развитие "языкового яруса" МИТС соответствующих "протоцивилизаций" и "ИВ обмана противника и развала его "округ""; (4) "сверхрайонов" Homo sapiens-2 БИТ письменности/чтения соответствует развитие "культурно-государственного яруса" МИТС локальных цивилизаций и ИВ по развалу "сверхрайонов" противника; (5) "сверхстран" Homo sapiens-3 БИТ тиражирования текстов/книгопечатания соответствует развитие "экономического яруса" МИТС субконтинентальных цивилизаций и ИВ по развалу "сверхстран" противника; (6) создаваемой Планетарной Цивилизации Homo sapiens-4 БИТ ло-кальных компьютеров соответствует развитие ее "высокотехнологического яруса" МИТС и ИВ по развалу образовываемых противником ее элементов;
(7) создаваемой Цивилизации Околоземного Космоса Homo sapiens-5 БИТ телекоммуникаций/сетей соответствует развитие ее "информационного яруса" МИТС и ИВ по развалу образовываемых противником ее элементов;
(8) создаваемой Цивилизации Промежуточного Космоса Homo sapiens-6 пер-спективной нано-БИТ соответствует развитие ее "личностно-космического яруса" МИТС и ИВ по развалу образовываемых противником ее элементов и т. д. Отмечается, что каждый новый этап этого коэволюционного процесса не отменяет результатов предыдущего, а дополняет и усложняет их.
Ключевые слова: базисные информационные технологии; информационное оружие; информационная безопасность; многомерный иерархический территориальный суверенитет; системная коэволюция; информатико-кибернетическая модель; самоуправляющаяся иерархо-сетевая система Человечества; принцип системной кумуляции; принцип системной согласованности
|
|