Маскирование данных с Jay Data: как разочаровать хакеров?

В России только за первую половину 2024 года количество утечек данных выросло на 10% по сравнению с аналогичным периодом 2023 года. В условиях постоянных киберугроз компании ищут надежные способы защиты своей информации. 

Маскирование данных — один из наиболее эффективных методов, который помогает сохранить конфиденциальность и минимизировать риски. А все ли данные можно замаскировать? Ответ на этот и другие важные вопросы мы узнали у Али Гаджиева, директора по продукту Jay Data.

✦ Для начала разберемся: что такое маскирование?

Маскирование данных — это любая замена чувствительной информации на синтетическую или обезличенную ее версию.

✦ Все ли данные можно маскировать?

Если отвечать коротко — да. Маскировать можно любые данные в зависимости от их типов: строковые, числовые, бинарные. Они могут быть структурированными и храниться в форматах JSON, XML и других. Также есть возможность маскировать и неструктурированные данные: форматы Word, Visio, Powerpoint, различные типы изображений. Например, в банковской среде один из самых популярных форматов неструктурированных данных – сканы паспортов, которые важно замаскировать. 

✦ В чем преимущество маскирования данных по сравнению с остальными способами защиты информации?

  • Во-первых, у компаний сохраняется ценность оригинальных данных для разработчиков, тестировщиков, аналитиков. Например, дата-сайентисты из банковской отрасли должны обучать разработанные модели на данных, но в целях минимизации утечек не могут использовать конфиденциальную информацию, поэтому им доступны обезличенные данные. Как заменить конфиденциальную информацию на синтетическую? Обезличить данные можно в ручном формате, но такой вариант займет много времени и ресурсов, также высока вероятность ошибки. Например, в одной базе данных Ивана заменили на Петра, а в другой  — на Сидора. 

Самый простой способ обезличить данные —  использовать специализированную систему, которая автоматически подготовит качественные замаскированные данные. С ее помощью можно сократить время тестирования продукта и выявить все баги на ранних стадиях.

  • Во-вторых, минимизирована вероятность утечки. Благодаря маскированию, данные становятся максимально безопасными. Как в крылатом выражении: «‎фарш назад не провернуть», так и восстановить реальные данные после обезличивания не получится. Хакеры также не заинтересованы в таких данных, так как не смогут узнать реальную контактную информацию клиентов или получить доступ к сделкам и конфиденциальным данным компании.

✦ Как возникла идея создания Jay Data — решения для маскирования данных?

При разработке Jay Data мы исходили из боли заказчика — отсутствие инструментов для поиска и защиты чувствительной информации. Поэтому один из основных модулей Jay Data реализован так, чтобы решить эту проблему: с его помощью можно автоматически находить чувствительную информацию в больших базах данных, во всех таблицах и столбцах.

Реализовав данный функционал, мы поняли, что большую часть работы по подготовке к обезличиванию данных проделали, оставалось только дополнить продукт некоторыми дополнительными инструментами. Запуск решения ускорили уход зарубежных компаний и рост спроса на российские продукты, связанные с маскированием. Планируемое ужесточение наказания за утечку персональных данных — повышение уровня штрафов — также мотивируют бизнес маскировать конфиденциальную информацию пользователей, переходить на российские ИБ-продукты. 

✦ Какие способы маскирования используются в Jay Data?

В зависимости от целей заказчика, решение использует различные способы маскирования. Например, компании необходимо просто обезопасить данные перед их передачей и в максимально короткие сроки замаскировать критически важную информацию. В таком случае Jay Data обнуляет эту информацию, заменяет ее на пустые значения или на константу, либо скрывает часть оригинальной информации  – например, добавляет три звездочки вместо значения. 

Для многих компаний этого способа маскирования недостаточно.  Например, при разработке или тестировании приложения важно сохранить качество обезличенных данных. Это означает, что необходимо не просто сгенерировать случайные синтетические данные, а сохранить структуру таблицы, оставив фамилии — фамилиями, имена — именами, то же самое касается банковских карт, ИНН, СНИЛС и так далее. Важно обеспечить консистентность этих данных, связанность их между таблицами и базами данных. Например, маскируя реального Иванова Ивана Ивановича на вымышленного Петрова Петра Петровича, нужно заменить его ФИО одинаково во всех документах, таблицах, столбцах, где оно фигурирует. В этом случае Jay Data предлагает методы обезличивания, которые могут заменить данные по справочникам, имена, адреса и т.д. 

Для ИНН, СНИЛС, номеров карт используются такие методы маскирования, которые не только заменяют одни цифры на другие, но и сохраняют контрольные разряды. Например, знали ли вы, что не все десятизначные числа могут быть ИНН юридического лица? Они формируются по определенной логике, которую учитывает Jay Data, генерируя значения, которые могли бы существовать в реальной жизни.

✦ Какие преимущества есть у решения Jay Data?

  • Гибкость.
Гибкость нашего решения по сравнению с конкурентными продуктами и другими способами по обезличиванию данных. Jay Data позволяет работать одновременно с разными типами баз данных: Oracle, MS SQL, PostgreSQL, ClickHouse, MariaDB, MySQL, IBM DB2, SAP HANA, Sybase. И не просто работать с различными СУБД, но и настраивать Jay Data в соответствии с запросами компании. У каждой организации есть свои особенности работы с данными, поэтому часто необходимо добавлять различные правила для поиска критической информации и ее обезличивания. Для того, чтобы пользователи не теряли время в ожидании обновления продукта, а начали прямо здесь и сейчас с ним работать, мы создали возможность гибкой кастомизации решения под запросы компании. 

  • Скорость.
Один из главных вопросов, который задают все заказчики при выборе решения: как быстро вы обезличиваете данные? Опыт многовендорных пилотов показал, что Jay Data является одним из лидеров на рынке по скорости маскирования данных. Решение позволяет увеличивать скорость маскирования за счет увеличения количества сервисов и горизонтального масштабирования. При подготовке каждого нового релиза решения мы работаем над тем, чтобы увеличивать скорость при минимальных конфигурациях.
Ленинградский проспект, д. 31А, стр. 1 125284 Москва, Россия
+7 (495) 532-10-96

Маскирование данных с Jay Data: как разочаровать хакеров?

  • Дата новости
    28 ноября 2024
  • Блог

В России только за первую половину 2024 года количество утечек данных выросло на 10% по сравнению с аналогичным периодом 2023 года. В условиях постоянных киберугроз компании ищут надежные способы защиты своей информации. 

Маскирование данных — один из наиболее эффективных методов, который помогает сохранить конфиденциальность и минимизировать риски. А все ли данные можно замаскировать? Ответ на этот и другие важные вопросы мы узнали у Али Гаджиева, директора по продукту Jay Data.

✦ Для начала разберемся: что такое маскирование?

Маскирование данных — это любая замена чувствительной информации на синтетическую или обезличенную ее версию.

✦ Все ли данные можно маскировать?

Если отвечать коротко — да. Маскировать можно любые данные в зависимости от их типов: строковые, числовые, бинарные. Они могут быть структурированными и храниться в форматах JSON, XML и других. Также есть возможность маскировать и неструктурированные данные: форматы Word, Visio, Powerpoint, различные типы изображений. Например, в банковской среде один из самых популярных форматов неструктурированных данных – сканы паспортов, которые важно замаскировать. 

✦ В чем преимущество маскирования данных по сравнению с остальными способами защиты информации?

  • Во-первых, у компаний сохраняется ценность оригинальных данных для разработчиков, тестировщиков, аналитиков. Например, дата-сайентисты из банковской отрасли должны обучать разработанные модели на данных, но в целях минимизации утечек не могут использовать конфиденциальную информацию, поэтому им доступны обезличенные данные. Как заменить конфиденциальную информацию на синтетическую? Обезличить данные можно в ручном формате, но такой вариант займет много времени и ресурсов, также высока вероятность ошибки. Например, в одной базе данных Ивана заменили на Петра, а в другой  — на Сидора. 

Самый простой способ обезличить данные —  использовать специализированную систему, которая автоматически подготовит качественные замаскированные данные. С ее помощью можно сократить время тестирования продукта и выявить все баги на ранних стадиях.

  • Во-вторых, минимизирована вероятность утечки. Благодаря маскированию, данные становятся максимально безопасными. Как в крылатом выражении: «‎фарш назад не провернуть», так и восстановить реальные данные после обезличивания не получится. Хакеры также не заинтересованы в таких данных, так как не смогут узнать реальную контактную информацию клиентов или получить доступ к сделкам и конфиденциальным данным компании.

✦ Как возникла идея создания Jay Data — решения для маскирования данных?

При разработке Jay Data мы исходили из боли заказчика — отсутствие инструментов для поиска и защиты чувствительной информации. Поэтому один из основных модулей Jay Data реализован так, чтобы решить эту проблему: с его помощью можно автоматически находить чувствительную информацию в больших базах данных, во всех таблицах и столбцах.

Реализовав данный функционал, мы поняли, что большую часть работы по подготовке к обезличиванию данных проделали, оставалось только дополнить продукт некоторыми дополнительными инструментами. Запуск решения ускорили уход зарубежных компаний и рост спроса на российские продукты, связанные с маскированием. Планируемое ужесточение наказания за утечку персональных данных — повышение уровня штрафов — также мотивируют бизнес маскировать конфиденциальную информацию пользователей, переходить на российские ИБ-продукты. 

✦ Какие способы маскирования используются в Jay Data?

В зависимости от целей заказчика, решение использует различные способы маскирования. Например, компании необходимо просто обезопасить данные перед их передачей и в максимально короткие сроки замаскировать критически важную информацию. В таком случае Jay Data обнуляет эту информацию, заменяет ее на пустые значения или на константу, либо скрывает часть оригинальной информации  – например, добавляет три звездочки вместо значения. 

Для многих компаний этого способа маскирования недостаточно.  Например, при разработке или тестировании приложения важно сохранить качество обезличенных данных. Это означает, что необходимо не просто сгенерировать случайные синтетические данные, а сохранить структуру таблицы, оставив фамилии — фамилиями, имена — именами, то же самое касается банковских карт, ИНН, СНИЛС и так далее. Важно обеспечить консистентность этих данных, связанность их между таблицами и базами данных. Например, маскируя реального Иванова Ивана Ивановича на вымышленного Петрова Петра Петровича, нужно заменить его ФИО одинаково во всех документах, таблицах, столбцах, где оно фигурирует. В этом случае Jay Data предлагает методы обезличивания, которые могут заменить данные по справочникам, имена, адреса и т.д. 

Для ИНН, СНИЛС, номеров карт используются такие методы маскирования, которые не только заменяют одни цифры на другие, но и сохраняют контрольные разряды. Например, знали ли вы, что не все десятизначные числа могут быть ИНН юридического лица? Они формируются по определенной логике, которую учитывает Jay Data, генерируя значения, которые могли бы существовать в реальной жизни.

✦ Какие преимущества есть у решения Jay Data?

  • Гибкость.
Гибкость нашего решения по сравнению с конкурентными продуктами и другими способами по обезличиванию данных. Jay Data позволяет работать одновременно с разными типами баз данных: Oracle, MS SQL, PostgreSQL, ClickHouse, MariaDB, MySQL, IBM DB2, SAP HANA, Sybase. И не просто работать с различными СУБД, но и настраивать Jay Data в соответствии с запросами компании. У каждой организации есть свои особенности работы с данными, поэтому часто необходимо добавлять различные правила для поиска критической информации и ее обезличивания. Для того, чтобы пользователи не теряли время в ожидании обновления продукта, а начали прямо здесь и сейчас с ним работать, мы создали возможность гибкой кастомизации решения под запросы компании. 

  • Скорость.
Один из главных вопросов, который задают все заказчики при выборе решения: как быстро вы обезличиваете данные? Опыт многовендорных пилотов показал, что Jay Data является одним из лидеров на рынке по скорости маскирования данных. Решение позволяет увеличивать скорость маскирования за счет увеличения количества сервисов и горизонтального масштабирования. При подготовке каждого нового релиза решения мы работаем над тем, чтобы увеличивать скорость при минимальных конфигурациях.
ЧИТАЙТЕ НАС
В TELEGRAM
НОВОСТИ – ИБ – КЕЙСЫ – ПРОДУКТЫ –
Общество с ограниченной ответственностью “Кросстех Солюшнс Групп” Адрес и телефон:
Ленинградский проспект, д. 31А, стр. 1 125284 Москва, Россия
Телефон:+7 (495) 532-10-96, E-mail: info@ct-sg.ru