|
Similar Journals
Труды Института системного программирования РАН
Number of Followers: 0 Open Access journal ISSN (Print) 2220-6426 - ISSN (Online) 2079-8156 This journal is no longer being updated because: the publisher no longer provides RSS feeds |
- Перспективы исследований татарского
языка на платформе LingvoDoc
Authors: Фануза Шакуровна НУРИЕВА, Гульшат Раисовна ГАЛИУЛЛИНА, Айрат Фаикович ЮСУПОВ
Abstract: В статье рассматриваются перспективы исследования татарского языка на платформе LingvoDoc. Цифровизация изучения языка в современной лингвистике позволяет перейти на новый уровень описания структуры языка. С 90-х годов прошлого века во всех европейских языках созданы большие корпуса, содержащие миллионы словоформ. В настоящее время это сделано не только в русском языке, но и во многих национальных языках России, таких как татарский, башкирский, удмуртский, марийский, мокшанский, коми и др. Одной из признанных площадок в современном отечественном языкознании является разработанная в ИСП РАН виртуальная лаборатория. Эта платформа дает возможность создавать, хранить и анализировать многослойные словари, языковые материалы и диалекты. Основным функционалом LingvoDoc пользуются более 250 лингвистов, обрабатывающих свои материалы онлайн, уже собрано более 1000 словарей и 300 корпусов текстов на национальных языках РФ. Мы рассматриваем возможности этой платформы для изучения татарского языка. Мы считаем, &...
PubDate: 2023-02-28
Issue No: Vol. 34 (2023)
- Оценка языковой способности нейронных
моделей на материале предикативного
согласования в русском языке
Authors: Ксения Андреевна СТУДЕНИКИНА
Abstract: Исследование нацелено на то, чтобы изучить способность нейронных сетей моделировать грамматику, которая проявляется в функции автоматической оценки грамматичности языковых выражений. В данной работе моделируются правила предикативного согласования по числу в русском языке. Для обучения языковых моделей был создан датасет, включающий искусственно сгенерированные грамматичные и неграмматичные предложения. Мы используем трансферное обучение предобученных нейронных сетей. Результаты показывают, что все рассмотренные модели демонстрируют высокие результаты при дообучении на задачу оценки грамматичности. Точность классификации снижается для предложений с неодушевленными существительными, поскольку для них, в отличие от одушевленных существительных, наблюдается совпадение форм именительного и винительного падежа. Сложность синтаксической структуры оказывается значимой для русскоязычных моделей и модели для славянских языков, но не влияет на распределени&...
PubDate: 2023-02-28
Issue No: Vol. 34 (2023)
- Влияние относительного продольного
расстояния на динамическое поведение
двух взаимодействующих судов при
встречном волнении
Authors: Рами АЛИ
Abstract: В работе исследуется влияние взаимного продольного положения на частотные характеристики двух взаимодействующих судов, плавающих неподвижно в непосредственной близости на встречном волнении и мелководье. Подход CFD был принят для моделирования динамического поведения взаимодействующих судов. Численное моделирование судов «Алексей Косыгин» и «Новгород», плавающих на встречных волнах при малом относительном поперечном расстоянии η=1,3, проводилось с использованием двух масштабных моделей. Исследовано влияние продольного расстояния на частотные характеристики обоих судов. Были проанализированы АЧХ вертикальной, килевой и бортовой качки для различных случаев, и на основе настоящего анализа были даны рекомендации по относительному продольному положению.
PubDate: 2023-02-28
Issue No: Vol. 34 (2023)
- Математическое моделирование процесса
течения газа в проточной части
турбомолекулярного вакуумного насоса с
использованием модели взаимодействия
газа с поверхностью Черчиньяни-Лампис
Authors: Ульяна Саидовна ГОРДЕЕВА, Феликс Маратович ШАРИПОВ
Abstract: В работе моделируется процесс течения газа в проточной части турбомолекулярного вакуумного насоса с использованием модели Черчиньяни-Лампис (ЧЛ), которая использовалась в качестве новых граничных условий при расчете вероятности перехода. При моделировании использовался метод пробной частицы (метод Монте-Карло). Произведен расчет вероятности перехода молекул через лопаточный канал в прямом и обратном направлениях, результирующей вероятности перехода, степени повышения давления.
PubDate: 2023-02-28
Issue No: Vol. 34 (2023)
- Модификация метода выделения контуров
объекта в интеллектуальных системах
Authors: Алексей Иванович МАРТЫШКИН, Елена Григорьевна БЕРШАДСКАЯ, Евгений Игоревич МАРКИН, Валентина Владимировна ЗУПАРОВА
Abstract: Данная исследовательская работа посвящена использованию компьютерного зрения в интеллектуальных системах для анализа контуров человека. С ростом технологий в различных отраслях промышленности возникает необходимость повышения эффективности систем "человек-компьютер". Предлагаемый метод использует видеокамеру и компьютерное программное обеспечение для обнаружения человека на изображении и его обработки с помощью библиотеки OpenCV и языка программирования C++. В статье рассматриваются существующие методы обнаружения человека, анализируется альтернативный метод, использующий компьютерное зрение, и разрабатывается новый метод обнаружения человека. Модификация включает в себя применение фильтра Кувахара для размытия изображения и алгоритма Собеля для выделения контуров. Области применения данной технологии включают обеспечение безопасности на транспортных узлах и в местах скопления людей, удаленный мониторинг здоровья, усиленный контроль на границах и охраняем...
PubDate: 2023-02-27
Issue No: Vol. 34 (2023)
- Автоматическая разметка данных для
сегментации изображений документов с
использованием глубоких нейронных
сетей
Authors: Андрей Анатольевич МИХАЙЛОВ
Abstract: В статье предложен новый метод автоматической аннотации данных для решения задачи сегментации изображений документов с помощью глубоких нейронных сетей обнаружения объектов. В качестве исходных данных для разметки рассматривается формат помеченных файлов PDF. Особенность данного формата заключается в том, что он включает в себя скрытые метки, которые описывают логическую и физическую структуру документа. Для их извлечения разработано инструментальное средство, которое имитирует работу стековой машины вывода на печать согласно спецификации формата PDF. Для каждой страницы документа генерируются изображение, и аннотация в формате PASCAL VOC. Классы и координаты ограничивающих рамок вычисляются в процессе интерпретации помеченного PDF файла на основе меток. Для апробации метода была сформирована коллекция размеченных PDF файлов из которой в автоматическом режиме получены изображения страниц документов и аннотации для трех классов сегментации. На основе этих данных обучена нейронна...
PubDate: 2023-02-27
Issue No: Vol. 34 (2023)
- Моделирование взаимосвязи между
заболеваниями с помощью
взаимодействующих потоковых X-машин
Authors: Дилшан ДЖАЯТИЛАКЕ, Хоа ФУНГ, Эммануэль ОГУНШИЛЕ, Мехмет АЙДИН
Abstract: Мир движется к альтернативной медицине и изменению методов лечения, контроля и профилактики хронических заболеваний. В последние несколько десятилетий диаграммные модели широко использовались для описания и понимания поведения биологических организмов (биологических агентов) благодаря их простоте и полноте. Однако эти модели могут предложить только статическую картину соответствующих биологических систем с ограниченной масштабируемостью. В результате растет спрос на интеграцию формализма в более динамичные формы, которые могут быть более масштабируемыми и могут охватывать сложные процессы, зависящие от времени. В этой статье мы представляем общую модель на основе теорий X-машин и взаимодействующих X-машин. Мы провели эксперимент по моделированию реального заболевания на примере диабета II типа. Результаты эксперимента демонстрируют, что предложенный метод способен моделировать хронические заболевания.
PubDate: 2023-02-27
Issue No: Vol. 34 (2023)
- Опция «Phonology» платформы LingvoDoc как способ
верификации (на материале сосьвинского
диалекта мансийского языка)
Authors: Наталья Андреевна КОШЕЛЮК
Abstract: В статье приводятся результаты исследования полевого материала сосьвинского мансийского диалекта села Ломбовож. Его экспериментально-фонологический анализ был выполнен с помощью современной системы обработки данных LingvoDoc. Сопоставление полученной в результате этого анализа системы гласных звуков с другими фонетическими системами сосьвинского диалекта, предложенными лингвистами XX в., позволило прийти к заключению о необходимости дальнейшего уточнения фонетической системы этого мансийского диалекта. Так, в процессе исследования были выявлены неточности в интерпретации полевого материала села Ломбовож, а также обнаружен ряд уникальных фонем (o, ɛ, e, i, ə, u), обладающих нехарактерными показателями для общепринятых параметров F1 и F2 международного фонетического алфавита, базирующегося в основном на данных анализа европейских языков.
PubDate: 2023-02-27
Issue No: Vol. 34 (2023)
- Поиск использований освобожденного
ресурса в исходном коде на языке C#
методами статического анализа
Authors: Ульяна Владимировна ТЯЖКОРОБ, Валерий Николаевич ИГНАТЬЕВ, Андрей Андреевич БЕЛЕВАНЦЕВ
Abstract: В данной работе описывается масштабируемый детектор для поиска использований освобожденного ресурса в исходном коде на основе статического символьного выполнения. Данный детектор выполняет межпроцедурный анализ, чувствительный к потоку управления и контексту вызовов. Детектор реализован в рамках промышленного инструмента SharpChecker, его точность (около 70% истинных срабатываний) позволяет включить его в число основных детекторов и предоставить функционал конечным пользователям. В работе рассматривается алгоритм детектора, адаптированный для SharpChecker. Также представлены результаты тестирования детектора на наборе ПО с открытым исходным кодом и примеры срабатываний на реальных проектах.
PubDate: 2023-02-26
Issue No: Vol. 34 (2023)
- Irbis: статический анализатор помеченных
данных для поиска уязвимостей в
программах на C/C++
Authors: Никита Владимирович ШИМЧИК, Валерий Николаевич ИГНАТЬЕВ, Андрей Андреевич БЕЛЕВАНЦЕВ
Abstract: Статический анализ помеченных данных может использоваться для обнаружения различных потенциальных уязвимостей в коде программ путём исследования потоков данных между истоками и стоками помеченных данных. Чаще всего помеченными называют данные, которые были получены из внешнего источника и не были должным образом проверены. Инструмент Irbis реализует статический межпроцедурный анализ помеченных данных на основе решения задачи IFDS (Interprocedural Finite Distributive Subset), а также различные расширения, улучшающие его масштабируемость, точность и полноту. В нём реализованы 4 детектора с разными определениями помеченных данных, используемыми для нахождения выхода за границы буфера, использования освобождённой памяти, использования константных паролей и утечек данных. Определения истоков, стоков и передаточных функций хранятся в формате JSON и могут изменяться пользователем. Мы сравнили результаты анализа на проекте Juliet Test Suite for C/C++ с несколькими другими анализаторами, такими как Infer, Clang Static Analyzer и Svace. Irbis смог продемонстрировать 100% покрытие...
PubDate: 2023-02-26
Issue No: Vol. 34 (2023)
- Система метрик для языков
программирования
Authors: Тимур Расимович ФАЙЗРАХМАНОВ
Abstract: Мы представляем, возможно, первое приближение метрик языков программирования, которые представляют собой спектр из более чем 70 уникальных и тщательно собранных измерений, по которым можно сравнивать любые два языка. Основываясь на метриках, человек может самостоятельно определить "лучший" для него язык и продемонстрировать, как сложные чувства, такие как "простота" и "легкость в использовании", часто встречающиеся в продвижении и спорах о том какой язык лучше, могут быть разложены на четкие и измеримые части. Мы разместили коллекцию в виде отдельного файла с открытым исходным кодом (здесь в качестве приложения), чтобы каждый мог принять участие в поиске новых и интересных измерений, используемых в практике, исследованиях, и разработке языков программирования. Метрики могут найти свое применение для сравнения языков, определения требований, создания рейтингов, советов разработчикам языков, а также просто для получения представления о возможностях в существующи...
PubDate: 2023-02-26
Issue No: Vol. 34 (2023)
- Математические и программные модели
задач технического зрения
робототехнических комплексов на основе
микропроцессоров “Эльбрус”
Authors: Никита Алексеевич БОЧАРОВ, Николай Борисович ПАРАМОНОВ, Олег Анатольевич СЛАВИН, Константин Александрович СУМИНОВ
Abstract: Создание новых поколений автономных робототехнических комплексов, систем распознавания и систем технического зрения в целом невозможно без использования современных компьютерных технологий. В данной статье представлены модели системы технического зрения роботов на базе микропроцессоров "Эльбрус". Были разработаны модели задач обнаружения, классификации и сегментации. Теоретические и экспериментальные результаты были получены на существующих и перспективных микропроцессорах "Эльбрус". Показано, что микропроцессоры "Эльбрус" могут быть основой бортовой системы технического зрения. Полученные авторами результаты свидетельствуют о перспективах импортозамещения в области робототехники.
PubDate: 2023-02-26
Issue No: Vol. 34 (2023)
- Влияние трансформаций на успешность
состязательных атак для
классификаторов изображений Clipped BagNet и
ResNet
Authors: Екатерина Олеговна КУРДЕНКОВА, Мария Сергеевна ЧЕРЕПНИНА, Анна Сергеевна ЧИСТЯКОВА, Константин Владимирович АРХИПЕНКО
Abstract: В нашей статье сравнивается точность классической модели ResNet-18 с точностью моделей Clipped BagNet-33 и BagNet-33 с состязательным обучением в разных условиях. Мы провели эксперименты для изображений, атакованных состязательной наклейкой, в условиях трансформаций изображений. Состязательная наклейка представляет из себя небольшую область атакуемого изображения, внутри которой значения пикселей можно неограниченно менять, что может порождать ошибки в предсказании модели. Трансформации атакованных изображений в данной статье моделируют искажения, появляющиеся в физическом мире, когда смена ракурса, масштаба или освещения изменяет распознаваемое изображение. Наши эксперименты показывают, что модели из семейства BagNet плохо справляются с изображениями в низком качестве. Также мы проанализировали влияние разных видов трансформаций на устойчивость моделей к состязательным атакам и переносимость этих атак.
PubDate: 2023-02-26
Issue No: Vol. 34 (2023)
- Исследование возможности применения
нейронных сетей для восстановления
изображения лица в системах
распознавания
Authors: Евгений Игоревич МАРКИН, Валентина Владимировна ЗУПАРОВА, Алексей Иванович МАРТЫШКИН
Abstract: Идентификация человека на цифровом изображении с помощью компьютерного зрения является важнейшим аспектом этой области. Наличие внешних объектов, таких как медицинские маски, которые закрывают часть лица, может резко снизить точность распознавания и увеличить ошибки от 5% до 50% в зависимости от алгоритма. В данной статье исследуется использование нейронных сетей, в частности генеративной состязательной сети (GAN), для решения задачи восстановления изображения лица, закрытого медицинской маской, для повышения точности распознавания лица.
PubDate: 2023-02-26
Issue No: Vol. 34 (2023)
- Статический анализатор для языков с
обработкой исключений
Authors: Виталий Олегович АФАНАСЬЕВ, Варвара Викторовна ДВОРЦОВА, Алексей Евгеньевич БОРОДИН
Abstract: В статье описывается статический анализ для языков с обработкой исключений. В данной работе предложено низкоуровневое промежуточное представление для поддержки исключений; описаны анализы потока данных для поиска недостижимого кода, связанного с исключениями; приведена общая схема для статического анализа с учётом возможных путей, возникающих при использовании исключений. Алгоритмы реализованы в анализаторе Svace для языков C++, Java, Kotlin.
PubDate: 2023-02-25
Issue No: Vol. 34 (2023)
- Повышение точности статического
анализа за счет учета значений полей
класса, имеющих единственное
константное значение
Authors: Вадим Сергеевич КАРЦЕВ, Валерий Николаевич ИГНАТЬЕВ
Abstract: В данной статье описывается подход, позволяющий с помощью предварительного анализа полей с единственным возможным значением повысить точность работы детекторов статического анализатора уровня символьного выполнения. Помимо этого, детектор предупреждает программиста о забытых модификаторах readonly и о неиспользуемых полях. Детектор был реализован в рамках промышленного статического анализатора SharpChecker для языка C#. Анализ проводится на уровне абстрактного синтаксического дерева, что позволяет снизить затраты времени и ресурсов. Сохраненные значения для ряда полей позволяют использовать конкретные константы вместо символьных значений на этапе символьного выполнения, тем самым повышая точность. В результате удалось заметно улучшить качество некоторых анализаторов, таких как UNREACHABLE_CODE (улучшение на 7.57%) или DEREF_OF_NULL (улучшение на 1.33%), и получить новые срабатывания в случаях с забытым readonly или неиспользуемыми полями. Хорошие результаты позволили включить детектор в основную ветку SharpChecker и предоставить ег...
PubDate: 2023-02-25
Issue No: Vol. 34 (2023)