Фильтрация нежелательных приложений трафика подвижной радиосвязи для обнаружения угроз информационной безопасности
Аннотация
В статье исследуется эффективность алгоритмов классификации машинного обучения: Naive Bayes; С4.5; Random Forests; Support Vector Machine (SVM); One Rule; Adaptive Boost мобильных приложе-ний Google Chrome, Instagram, Facebook, Messenger, Whatsapp трафика подвижной радиосвязи. Для оценки эффективности алгоритмов классификации использовались метрики: Precision, Recall, F-Measure, AUC. Показано, что среди алгоритмов классификации машинного обучения наилучшим является алгоритм Random Forest. Среди анализируемых приложений наиболее эффективно классифицируются приложения Google Chrome и Whatsapp. Наиболее сложными для автоматической классификации методами машинно-го обучения оказались приложения Facebook и Messenger. Представленные результаты предлагается ис-пользовать при выборе наилучших алгоритмов классификации, оценки объёма обучающей и тестирующей выборок для достижения высоких показателей качества классификации в условиях появления неконтро-лируемого (фонового) трафика; обеспечить возможность создания технологий законного перехвата сете-вого трафика по аналогии с телефонными компаниями основываясь на технологиях классификации сетево-го трафика.