В современном понимании эксплуатация высокопроизводительного вычислительного комплекса специального назначения – это комплексное организационно-техническое решение, предназначенное для поддержания высокопроизводительной и отказоустойчивой информационной инфраструктуры в области сбора, хранения, передачи данных и выполнения трудоемких вычислений.
По опыту эксплуатации основными категориями аварийных ситуаций на высокопроизводительных вычислительных комплексах специального назначения являются отказы инженерного оборудования и ошибки эксплуатирующего персонала. Для уменьшения интенсивности отказов оборудования второй категории аварийных ситуаций необходима разработка инструмента помощи эксплуатирующему персоналу. Таким инструментом может являться перспективная автоматизированная система управления, включающая в себя разнородные подсистемы, охватывающие все аспекты функционирования высокопроизводительных вычислительных комплексов военного назначения. Проблематикой данной статьи является концептуальная проработка такой перспективной автоматизированной системы управления, которая обеспечит безаварийную эксплуатацию высокопроизводительных вычислительных комплексов специального назначения. В зависимости от данных, с которыми работают подсистемы, рассматриваемую перспективную автоматизированную систему управления условно можно разделить на оперативную и стратегическую составляющую. Оперативная предназначена для немедленного реагирования с целью поиска наиболее рациональных вариантов преодоления аварийных ситуаций. Стратегическая составляющая ПАСУ ориентирована на обработку и анализ значительных объемов разнородной информации, собираемых с подсистем для достоверного прогнозирования аварийных ситуаций.