Разработчик-исследователь в группу анализа методов детектирования

Company Name: Kaspersky Lab jobs, Employment

Location: RU

Overview

О команде:
Группа Detection Methods Analysis решает разнообразные задачи кибербезопасности, связанные с анализом данных, в частности, с применением методов машинного обучения.
Одна из главных задач группы – разрабатывать алгоритмы автоматического детектирования вредоносных программ. Исходные данные – это программы (исполняемые файлы, скрипты разных типов) или логи активности процессов, рабочей станции, или сети компании. Мы рассматриваем разные постановки задачи. Базовый вариант – задача классификации исполняемых файлов на вредоносные и чистые.
В нашем распоряжении выборки из сотен миллионов объектов, часть из которых имеет надежную разметку “плохой”-”хороший”.
Мы работаем в динамично меняющихся условия: злоумышленники активно развивают свои технологии. Методы, которые мы с успехом применяем сегодня, завтра могут потерять свою эффективность. Поэтому мы постоянно продолжаем поиски лучших алгоритмов. А также активно занимаемся автоматизацией и развитием инфраструктуры, чтобы выпуск обновлений наших моделей был легче и происходил чаще. 

Для чего Вы нам нужны:
•    Работать в команде увлеченных своим делом специалистов. Познакомиться с интересной, быстро развивающейся предметной областью с большим количеством нерешенных задач
•    Читать статьи, искать идеи (возможно, из других областей), решать практически значимые задачи
•    Прототипировать решения, ставить эксперименты и интерпретировать результаты совместно с cyber-security экспертами 
Результаты наших исследований используются как inlab, так и в продуктах, помогая защищать миллионы пользователей и тысячи компаний от шпионажа, финансового ущерба, мошенничества и вымогательства. 
Что для этого необходимо:
•    Иметь высшее профильное образование
•    Иметь хорошую подготовку по математическим дисциплинам, связанным с анализом данных и машинным обучением
•    Обладать опытом исследований или решения практических задач в области анализа данных и машинного обучения 
•    Знать алгоритмы и структуры данных. Уметь оценивать алгоритмическую сложность своих решений. 
•    Уметь быстро и эффективно воплощать идеи в коде. Знание Python, пакетов и фреймворков для работы с данными, машинного обучения
•    Уметь самостоятельно и эффективно разбираться со статьями уровня конференций ICML, NIPS на уровне достаточном для реализации предложенных методов
•    Инициатива, изобретательность, искренний интерес к задачам анализа данных
Будет плюсом:
•    Опыт решения задач на Spark, оптимизации вычислений
•    Интерес и опыт в решении инженерных задач обработки больших выборок, построения пайплайнов обучения  
•    Систематическое образование в области анализа данных (ШАД или альтернативные продвинутые программы)