Из-за простоев и сбоев в работе приложений и сайтов российские организации теряют около 20 млн долларов в год, говорится в исследовании компании Veeam Software. Причем основной ущерб от таких нарушений носит нематериальный характер: теряется доверие сотрудников к компании и потребителей к бренду, нарушается ранжирование в поиске, страдает репутация производителя. В условиях высокой конкуренции на рынке эти факторы могут стать причиной дальнейшего разорения компании, особенно, если сбои в работе случаются регулярно. Предотвращением таких последствий уже более 10 лет занимается DevOps-инженер и IT-менеджер Илия Карин, который настраивает отказоустойчивые инфраструктуры в крупнейших компаниях России разных сфер экономики. Благодаря реализации сложнейшего проекта он вывел в лидеры отрасли банк ВТБ, в холдинге «Самотлор» создал файловый сервис, способный пережить одновременное падение нескольких серверов, а уникальный опыт, полученный в «дочке» «Газпрома» — компании ППТК — позволил ему стать экспертом, за консультациями к которому теперь обращаются другие организации IT-рынка.
Как настроить надежность
Отказоустойчивые системы способны выдержать большинство угроз стабильности работы компании и уберечь их от репутационных и финансовых потерь. Причем перечень рисков включает не только человеческий фактор или технические неполадки, но и всевозможные стихийные бедствия: пожар, сильный ветер, дождь или землетрясение. Подобные системы критически важны для стабильной работы компаний и пользуются большим спросом.
Одну из таких систем Илия Карин создал в техподразделении ВТБ — компании «Иннотех». Проект стал самым сложным и дорогостоящим в его карьере.
«Стояла задача настроить отказоустойчивость банковского ядра — программного комплекса, через который проходят все платежи финансовой организации. Он фиксирует балансы счетов, правильность списания и отправки транзакций. Поэтому к надежности работы этого ПО предъявляются особенно высокие требования» — объясняет инженер.
В «Иннотехе» он внедрил лучшие практики DevOps и автоматизацию CI/CD. Илия Карин полностью переработал процессы деплоя банковского ядра, в целом улучшил его работу, обновление и повысил безопасность сервиса с оборотом в 34,8 триллиона рублей в год.
Благодаря этому банк неоднократно получал высокие отраслевые награды за внедрение передовых цифровых сервисов и большой вклад в развитие государства. Достичь такого высокого результата инженеру помогла многолетняя реализация подобных проектов в других крупных организациях, работающих в разных отраслях экономики. Так, в компании ППТК, которая входит в структуру «Газпрома», Илия Карин всего за четыре года — с 2015 по 2019 годы — перестроил всю инфраструктуру в соответствии с лучшими практиками надежности и отказоустойчивости, а также ввел систему безопасности и аудита.
Уже в тот период он освободил офис от системных блоков, внедрив технологию на базе Windows Terminal Server. Вместо больших системных блоков у сотрудников стояли маленькие ПК — всего 10 на 10 см, в которых не было даже жестких дисков — вся загрузка происходила по сети по технологии PXE boot. Каждый человек мог сесть на любое рабочее место, ввести логин и пароль и получить свой «компьютер». Все нужные данные хранились на серверах в безопасности. Причем получить доступ к ним можно было даже из офиса в другом городе.
Илия Карин стал одним из первых на рынке EMEA специалистов, внедривших All-Flash Array от компании Pure Storage, причем процесс интеграции СХД проходил на базе iSCSI-технологии на нераспространенном оборудовании от Ubiquiti.
Этот опыт стал настолько исключительным, что у инженера начали массово консультироваться другие игроки IT-рынка, а компания ППТК сэкономила существенные средства на внедрении технологии и получила огромное преимущество в отрасли.
«СХД выдавал 200 тысяч IOPS, без задержек и влияния на инфраструктуру мог делать резервное копирование благодаря глубокой интеграции с гипервизором VMware ESXi и, что самое интересное, этот массив стоил в разы дешевле, чем у конкурентов. А благодаря моей экспертизе я смог внедрить его на очень сложной для отрасли технологии iSCSI. В основном все строят Data-сети на Fibre Channel, но он требует дополнительного дорогостоящего оборудования. Я же использовал 10Gbit-свитчи от UniFi, тонкую настройку VMware ESXi и сетевые карты массива Pure Storage и смог добиться большей производительности, чем по FC и аналогичной Latency», — рассказывает Илия Карин.
Еще одну необычную систему отказоустойчивости он внедрил в ГК «Самотлор», которая выпускает напольные покрытия. Здесь инженер создал файловый сервис на базе Windows File Server DFS, который мог пережить падение нескольких серверов без потери данных и деградации производительности. Он также поддерживал систему управления версиями документов и восстановление как целых дисков, так и отдельных файлов из структуры директорий.
«В главном офисе и нескольких крупных филиалах я построил сети бесшовного Wi-Fi, позволяющие перемещаться по зданию без ухудшения качества связи. То есть сигнал не пропадает, и вы не испытываете никаких неудобств во время разговора, например, по Skype», — объясняет инженер.
Также благодаря Илие Карину в холдинге появилась специализированная система поддержки клиентов Service Desk с профильным отделом Help Desk и ITIL практики, которые обеспечили непрерывную работу компании со стороны IT-подразделения.
Сейчас DevOps-инженер создает платформу будущего для управления частным капиталом в компании INVENT, которая занимается разработкой и интеграцией цифровых экосистем с полным переходом на открытое программное обеспечение и прохождением аудита SOC2.
И здесь перед ним тоже стоит задача создания максимально надежной и безопасной инфраструктуры. Эта платформа изменит рынок консультационных финансовых услуг, но подробности проекта Илия Карин пока не раскрывает. Известно лишь, что разработчики под его руководством делают акцент на стабильности, масштабируемости и безопасности платформы, на которой клиенты смогут как получать готовую функциональность, так и расширять ее по своему усмотрению.
От инженерии к менторству
Высокий спрос на отказоустойчивые системы и острая нехватка специалистов, способных их настроить, привлекают к Илие Карину пристальное внимание не только ведущих компаний России, но и организаторов различных профильных конкурсов и хакатонов, помогающих молодым IT-специалистам проявить себя. DevOps-инженер участвует в них как судья и как ментор, направляя лучшие команды к победе и анализируя перспективность представленных ими проектов.
Одним из крупных хакатонов стал Sberhack Advanced 2021, на который Илию Карина пригласили коллеги из Russian Hackers — крупнейшего сообщества IT-специалистов и компаний на русском языке. На конкурс поступило 811 заявок, после отбора участников было сформировано 70 команд, состоящих из независимых разработчиков. В течение 50 часов в режиме онлайн они реализовывали свои проекты, используя облачную платформу SberCloud.Advanced. Илия Карин стал наставником команд хакатона.
«Я помогал им с составлением питчей и „тестировал“ их на качество, рекомендовал, какой из аспектов стоит раскрыть лучше, а что, наоборот, упоминать не стоит», — объясняет инженер.
Лучшие работы он отбирал по четырем параметрам: оригинальность, релевантность, качество и эффективность использования облачных сервисов. Илия Карин углубился в решение каждого из этих проектов, чтобы проанализировать их зрелость и сильные стороны. Подобный опыт, говорит инженер, помогает не только изучать свежие идеи отрасли, но и знакомиться с перспективными молодыми специалистами, общение с которыми обогащает собственные компетенции.
Вектор — на финтех
Лучшие банковские приложения и сайты с самыми надежными IT-инфраструктурами создаются в России — это признает все мировое сообщество. Илия Карин убежден, что финансовые технологии должны быть одинаково надежны и устойчивы во всем мире, и знает, как это сделать.
«Если взять даже самые крупные финансовые корпорации нашей планеты, такие, например, как Bank of America, State Street Corporation или BlackRock, то я вижу, что там есть масса работы для цифровой трансформации и внедрения отказоустойчивых систем», — говорит DevOps-инженер.
Илия Карин ставит перед собой амбициозную цель — поработать над отказоустойчивостью гигантов мировой экономики. Это позволит в разы улучшить финансово-экономические показатели организаций, повысит качество услуг и безопасность данных клиентов и в развитых странах.