Выбор технологического направления создания высокопроизводительных информационно-вычислительных систем управления геолого-геофизическими данными (в рамках программы СКИФ-НЕДРА)

Юсупов Р. М., Жаворонкин О. В.

ОА «ОТ-ОЙЛ», г. Москва, Россия

 

Постоянно повышающиеся требования к информационно-вычислительным ресурсам при решении задач интерпретации геолого-геофизической информации ставит задачу выбора направления исследований и разработки информационных технологий создания высокопроизводительных многоуровневых систем хранения геолого-геофизических данных, обеспечивающих управление жизненным циклом информации при решении геолого-геофизических задач с применением прикладного программного обеспечения, входящего в состав комплекса программных и технических средств. Актуальным подходом к решению данной задачи является инициация программы «СКИФ-НЕДРА», направленной на содействие обеспечению энергетической и технологической безопасности государств-участников Союзного государства за счет разработки и создания высокотехнологичного, инновационного инструмента — предметно-ориентированных суперкомпьютерных технологий, включая высокопроизводительные ЭВМ «СКИФ—ГЕО» и комплект прикладного программного обеспечения обработки и моделирования геолого-геофизических данных «ПО СКИФ—НЕДРА», обеспечивающих увеличение эффективности поисков,  разведки, разработки и использования ресурсного потенциала минерально-сырьевой базы государств-участников. На сегодняшний день програм­ма находится на этапе завершения выбора направления исследований и разработки инфор­мационных технологий создания высокопроизводительных многоуровневых систем хране­ния геолого-геофизических данных, обеспечивающих управление жизненным циклом ин­формации при решении геолого-геофизических задач.

Проведенный обзор прикладных продуктов для нефтегазовой отрасли подтверждает вывод о том, что комплексное решение задач предприятия и отрасли в целом не может быть достигнуто в рамках единого монолитного приложения. Широкому спектру задач нефтегазовых компаний соответствует не менее широкий набор прикладных решений, каждое из кото­рых обладает значимыми преимуществами при решении тех или иных видов задач. Таким образом, наиболее эффективным с точки зрения решения бизнес-задач будет комбинирова­ние функциональности ряда готовых продуктов в рамках пакета прикладного ПО. При таком подходе ключевой технологией для обеспечения успешного функционирования интегриро­ванной системы становится реализация унифицированного метода обмена информацией между прикладными компонентами и соответствующих ему технических средств.

В раках всестороннего исследования применяемых для данного класса задач техноло­гий, была выполнена группировка по следующим направлениям: получение, хранение, обра­ботка, извлечение, анализ данных (табл. 1). По каждому направлению приведено несколько актуальных технологических трендов и оценен научно-технический уровень и фазы их раз­вития.

Ключевым выводом данного этапа НИР программы является определение направлений и требований к результатам дальнейших работ по выполнению программы «СКИФ-НЕФРА»:

  1. Разработать архитектуру программной системы обработки геолого-геофизических дан­ных, обеспечивающую возможность замены прикладных программных компонентов при сохранении инфраструктурной целостности системы за счет использования общей ин­формационной модели, подсистем НСИ и мастер-данных и информационного обмена.
  2. Реализовать технологии трансформации распределенных массивов разнородных данных тера- и петабайтного объема, обеспечения доступа к ним при помощи логической вит­рины данных, использующей общую информационную модель (или федерацию моде­лей), построенную на основе концептуальной модели предметной области.
  3. В качестве одного из способов применения логической витрины данных — реализовать технологии автоматического построения срезов информации, подготовленной для ана­лиза в виде OLAP-кубов или наборов данных в поколоночных, noSQL-хранилищах, на основе запросов пользователя, формируемых в терминах информационной модели.
  4. Разработать методику построения концептуальных моделей, и формирования информа­ционных моделей на их основе, адаптированную для применения в области геологии и геофизики. Создать ядро концептуальной модели для геологии и геофизики, опираясь, в том числе, на лучшие мировые практики и распространенные открытые форматы и стан­дарты.
  5. Реализовать концепцию и платформу системы имитационного моделирования, позволя­ющую пользователю самостоятельно ставить и решать задачи в процессе принятия реше­ний с использованием любых доступных наборов данных и алгоритмов.
  6. Разработать концепцию, методологию и способы реализации централизованного мони­торинга технологических процессов в ходе разведки, разработки и эксплуатации место­рождений, основанные на системах показателей, формируемых при помощи концептуальной модели предметной области.

Таблица 1

Информационные технологии решения задач интерпретации геолого-геофизической информации и геолого-гидродинамического моделирования

Направление

Технология

Фаза зрелости

Научно-технический уровень

Получение данных

Сбор данных со множества сенсоров (промышленные применения концепции Internet of Things)

Пик ожиданий

Лучшая отечественная практика

«Облачные» хранилища на основе семейств столбцов и распределенных файловых систем

Склон просвещения

Лучшая отечественная практика

noSQL-хранилища тера- и петабайтных объемов относительно однородной информации (часть концепции BigData): key-valueхранилища, хэш-таблицы, хранилища иерархических структур

Разрушение иллюзий

Лучшая отечественная практика

Графовые базы данных

Графовые базы данных

Лучшая мировая практика

Обработка

Параллельные вычисления MapReduce (часть концепции BigData)

Плато продуктивности

Лучшая отечественная практика

Связывание разнородных данных при помощи федерации концептуальных, информационных моделей

Инновация

Лучшее научное достижение

Использование каталогов НСИ и мастерданных для связывания разнородных данных

Плато продуктивности

Лучшая отечественная практика

Извлечение

Логические витрины данных на основе информационной модели

Рост ожиданий

Лучшее научное достижение

Запросы на контролируемом естественном языке

Разрушение иллюзий

Лучшее научное достижение

Анализ

Базы данных с поколоночным хранением

Склон просвещения

Лучшая отечественная практика

Базы данных с вычислениями в памяти (in-memorydatabase)

Плато продуктивности

Лучшая отечественная практика

Моделе-ориентированные архитектуры аналитического программного обеспечения

Инновация

Лучшее научное достижение

Платформы имитационного моделирования

Рост ожиданий

Лучшее научное достижение

Средства качественного анализа данных

Инновация

Лучшее научное достижение

Применение нейросетей, нечеткой логики для анализа данных

Разрушение иллюзий

Лучшее научное достижение


ЛИТЕРАТУРА

  1. Юсупов Р.М. Управление геолого-геофизическими и промысловыми данными // Нефтяное хозяйство. – 2013. – № 9. − C. 36–39.
  2. Stonebraker, Michael, et al. The End of an Architectural Era (It’s Time for a Complete Rewrite) // VLDB '07 Proceedings of the 33-rd international conference on Very large databases. – 2007. – Р. 12–14.
  3. Tim Kraska, Beth Trushkowsky. The New Database Architectures, IEEE Internet Computing, IEEE Computer Society, May/June. – 201 – Р. 111–119.
ОТ-ОЙЛ Россия, 117465, г. Москва, ул. Генерала Тюленева, д. 4А, стр. 3, офис 201 +7 (495) 565-35-96