Приглашаем всех желающих посетить бесплатные пробные занятия по курсам МВА и профессиональной подготовки. Занятия проходят в реальных группах, никаких постановочных занятий. Ознакомиться с расписанием пробных занятий, выбрать заинтересовавшее и зарегистрироваться на него можно здесь
Разработка методики выбора и экономическое обоснование внедрения инструмента класса SSDP (Self Service Data Preparation) в крупном банке
Скрынников Д. А.
выпускник группы MBA CIO-48
Школы IT-менеджмента
РАНХиГС при Президенте РФ
Сегодня основу эффективности работы современной организации составляют различные информационные технологии. Те, кто сумел ими с толком воспользоваться, быстрее разрабатывают инновационные продукты и получают конкурентные преимущества. Совершенно очевидно, что неотъемлемой частью процесса работы такой организации являются данные. Данные могут быть получены как в результате работы самой организации, так и из внешних источников. Нонеобходимо не просто собирать и хранить большие объемы информации, а использовать их для построения своей конкурентной стратегии на знаниях, извлекаемых из данных. Основным инструментом извлечения знаний из данных являются средства бизнес-аналитики, взгляд на которые в последнее время существенно изменился.Средства хранения и анализа данных совершили качественный скачок: появились технологии, позволяющие относительно недорого хранить и анализировать петабайты структурированных и не структурированных данных. Совокупность таких данных, технологий их хранения и средств обработки получила общее название – Большие данные (BigData). ИТ-словарьGartner дает следующее определение:
Большие данные - быстро изменяющиеся информационные активы больших объемов, обладающие разнообразием форм и требующие современных и эффективных способов обработки, включающих углубленное изучение, принятие решений и автоматизацию рабочих процессов.
Таким образом, термин «Большие данные», включает в себя:
1. Данные. Большие массивы цифровых структурированных и неструктурированных данных.
2. Технологии. Возможность хранить и обрабатывать практически неограниченные объемы данных любой структуры. Снижение стоимости хранения и обработки данных.
3. Аналитикаи Машинное обучение. Выявление скрытых зависимостей на основе анализа всего объема данных, машинное обучение.
Билл Фрэнкс в книге «Революция в аналитике. Как в эпоху Big Data улучшить ваш бизнес с помощью операционной аналитики»знаменует появление новой интегрированной и развитой аналитической парадигмы -Аналитика 3.0. Она объединяет аналитику на основе традиционных данных с новой аналитикой больших данных. Когда организации начали использовать большие данные, они обнаружили, что невозможно выделить аналитику больших данных в полностью автономную функцию, они требуют интеграции со всеми процессами организации. Так появляется понятие "Data-driven" организации.Термин "Data-driven" означает "управляемый на основе данных"или"приводимыйв движение данными". Есть множество описанных применений технологий data-driven для разработки или маркетинга, однако о комплексном применении глубокой аналитики для принятия решений во всех сферахстали говорить сравнительно недавно.Особенностью нового подхода является то, что в основе работы data-drivenорганизации лежит культура обращения с данными, которая становится движущей силой стратегического развития компании в целом.На первый взгляд, преобразование в организацию, управляемую на основе данных, может показаться делом простым, но в реальности быстрого и лёгкогоспособа нет. От организации, желающей стать data-driven, потребуется проведение технологической и культурной революции.
Наш Банк непрерывно повышает степень своей технологичности, но чтобы сохранять и укреплять свои лидирующие позиции, необходим переход на качественно новый уровень эффективности работы с данными, как со стратегическим активом Банка.Большинство компаний, так или иначе, проходят тернистый путь от беспорядочной работык организации и упорядочиванию, при котором руководство начинает реально управлять ситуацией, а не постфактум исправлять ошибки.Одной из основных проблем в управлении является недостаток или недостоверность данных,используемых для принятия решения. Именно проблему недостатка данных для принятия решения и хотелось бы рассмотреть более подробно.
В рамках выпускной аттестационной работы будет рассмотрен проект выбора и внедрения нового для Банка решения самостоятельной подготовки данных Self-Service Data Preparation (SSDP). В Банке на протяжении многих лет для задач загрузки и обработки данных используются промышленные инструменты класса ETL. Требования к подобному классу решений со временем только растут. Теперь инструменты обработки данных должны быть понятны не только ИТ-специалистам, но и бизнес-пользователям. А также должны помогать принимать управленческие решения в компании без дополнительных временных затрат на подготовку и интерпретацию информации для руководства.Как отмечает Gartner, «Тенденция к непринужденности использования и гибкости, которое разрушило рынки BI и аналитики, теперь касается и области интеграции данных».Эта тенденцияне открытие этого года, а уверенное развитие уже существующего тренда. Так, например, в этом году многие организации обратили свое внимание на инструменты самостоятельной подготовки данных (Self-Service Data Preparation). Это инструменты, которые позволяют автоматизировать и упростить загрузку структурированных и слабоструктурированных данныхв систему бизнес-аналитики, обобщать и структурировать информацию из различных источников, подготавливать их для дальнейшего анализа. В отличие от промышленного ETL, где основным пользователем является ИТ-специалист, обладающий специализированными знаниями, инструмент самостоятельной подготовки данныхдает возможность силами бизнес-пользователей(business-analyst, data-engineer, data-scientist)выполнить первичную загрузку, обработку и трансформацию данныхс целью их исследования и использования в работе.Другими словами,инструмент помогает бизнес-пользователям, даже без особых технических навыков, ускорить извлечение пользы из данных (datainsights) за счет сокращения времени на подготовку данных для анализа. В результате бизнес-пользователи способны самостоятельно решать задачи глубокого анализа и предоставлять ответы на вопросы, помогающие принимать управленческие решения.
Работа включает рассмотрение следующих вопросов:
· процесс управления корпоративной ИТ-архитектурой Банка;
· предпосылки появления нового класса инструментов в стратегии развитияИТ-ландшафта Банка;
· финансово-экономическая оценка проекта;
· сбор требований и разработка методики выбора инструмента класса SSDP;
· фаза реализации проекта.
В заключительной частисформулированы результаты работы исделаныосновные выводы:
1. Необходимость непрерывного системного анализа мировых тенденций в области высоких технологий и построения организаций будущего.
2. Для преодоления сопротивления со стороны сотрудников, не готовых к переменам, необходимо заручиться поддержкой высшего руководства организации.
3. Данные - ценнейший актив организации, к которому должен быть обеспечен прямой и быстрый доступ.
4. Соблюдение конфиденциальности – этоодин из важнейших вопросов связанных с использованием больших данных.
Комплексное рассмотрение проекта дает представление о возможностях ИТ как инструмента для развития бизнеса.
- Войдите на сайт для отправки комментариев