RU2013153768A

RU2013153768A - Система и способ оценки надежности правила категоризации

Info

Publication number: RU2013153768A
Application number: RU2013153768/08A
Authority: RU
Inventors: Алексей Евгеньевич Антонов; Алексей Михайлович Романенко
Original assignee: Закрытое акционерное общество "Лаборатория Касперского"
Priority date: 2013-12-05
Filing date: 2013-12-05
Publication date: 2015-06-10
Also published as: RU2587429C2; US20150161523A1; US9501742B2; CN104504334A; CN104504334B

Abstract

1. Способ признания правила категоризации надежным, в котором:а) создают при помощи средства создания правила категоризации правило категоризации, применение которого к файлу позволяет определить принадлежность рассматриваемого файла к одной из определенных в рамках правила категорий файлов;б) собирают при помощи средства сбора статистики статистку использования, по меньшей мере, одного созданного правила категоризации, при этомстатистика использования правила категоризации представляет собой информацию о множестве файлов, принадлежащих к каждой из категорий, которые определены в рамках упомянутого правила категоризации;в) определяют при помощи средства определения надежности степень надежности правила категоризации на основании статистики использования правила категоризации с использованием, по меньшей мере, одного алгоритма интеллектуального анализа данных;г) признают при помощи средства определения надежности правило категоризации надежным, если комбинация степеней надежности правила, определенных на этапе в), превышает установленный числовой порог.2. Способ по п.1, в котором правило категоризации применяют к результатам обработки файла.3. Способ по п.2, в котором обработкой файла является эмуляция процесса выполнения файла.4. Способ по п.2, в котором обработкой файла является вычисление свертки файла.5. Способ по п.1, в котором правилом категоризации является правило для обнаружения вредоносного программного обеспечения.6. Способ по п.1, в котором правилом категоризации является свертка файла, которая определяет, входил ли файл в категорию файлов с совпадающим значением свертки.7. Способ по п.1, в

Claims

1. Способ признания правила категоризации надежным, в котором:

а) создают при помощи средства создания правила категоризации правило категоризации, применение которого к файлу позволяет определить принадлежность рассматриваемого файла к одной из определенных в рамках правила категорий файлов;

б) собирают при помощи средства сбора статистики статистку использования, по меньшей мере, одного созданного правила категоризации, при этом

статистика использования правила категоризации представляет собой информацию о множестве файлов, принадлежащих к каждой из категорий, которые определены в рамках упомянутого правила категоризации;

в) определяют при помощи средства определения надежности степень надежности правила категоризации на основании статистики использования правила категоризации с использованием, по меньшей мере, одного алгоритма интеллектуального анализа данных;

г) признают при помощи средства определения надежности правило категоризации надежным, если комбинация степеней надежности правила, определенных на этапе в), превышает установленный числовой порог.

2. Способ по п.1, в котором правило категоризации применяют к результатам обработки файла.

3. Способ по п.2, в котором обработкой файла является эмуляция процесса выполнения файла.

4. Способ по п.2, в котором обработкой файла является вычисление свертки файла.

5. Способ по п.1, в котором правилом категоризации является правило для обнаружения вредоносного программного обеспечения.

6. Способ по п.1, в котором правилом категоризации является свертка файла, которая определяет, входил ли файл в категорию файлов с совпадающим значением свертки.

7. Способ по п.1, в котором предварительно осуществляется обучение алгоритмов интеллектуального анализа данных.

8. Способ по п.7, в котором для обучения используется множество файлов для обучения, а также статистика использования правил, применение которых к множеству файлов для обучения разбивает указанное множество файлов на категории таким образом, что хотя бы одна категория файлов в соответствии с правилом категоризации представляла собой однородное множество файлов, которое состоит только из похожих файлов.

9. Способ по п.8, в котором похожими файлами считают файлы, степень сходства между которыми превышает заранее установленный порог.

10. Способ по п.9, в котором степень сходства между файлами определяют на основании степени сходства данных, хранящихся в файлах.

11. Способ по п.9, в котором степень сходства между файлами определяют на основании степени сходства функционала файлов.

12. Способ по п.11, в котором в качестве функционала файла используют журнал вызовов API-функций операционной системы при эмуляции исполнения файла.

13.Способ по п.9, в котором степень сходства определяют в соответствии с одной из метрик: Хэмминга, Левенштейна, Жаккара, Дайса.

14. Способ по п.1, в котором в качестве алгоритма интеллектуального анализа данных используется один из алгоритмов иерархической кластеризации, нечеткой кластеризации, алгоритм минимально покрывающего дерева.

15. Система признания правила категоризации надежным, которая содержит:

а) средство создания правила категоризации, предназначенное для создания правил категоризации; применение правила категоризации к файлу позволяет определить принадлежность рассматриваемого файла к одной из определенных в рамках правила категорий файлов;

б) средство сбора статистики, связанное со средством создания правил категоризации и предназначенное для сбора статистики использования, по меньшей мере, одного правила категоризации, при этом

статистика использования правила категоризации представляет собой информацию о множестве файлов, принадлежащих к каждой из категорий, определенных в рамках упомянутого правила категоризации;

в) базу данных файлов, связанную со средством сбора статистики и предназначенную для хранения файлов, которые использует средство сбора статистики для получения статистики использования правил категоризации;

г) средство определения надежности, связанное со средством сбора статистики и предназначенное для определения степени надежности правила категоризации на основании статистики использования правила категоризации, полученной от средства сбора статистики,

при помощи, по меньшей мере, одного алгоритма интеллектуального анализа данных, а также признания правила категоризации надежным, если комбинация указанных степеней надежности, превышает установленный числовой порог.

16. Система по п.15, в которой средство сбора статистики применяет правило категоризации к результатам обработки файла.

17. Система по п.16, в которой обработкой файла является эмуляция процесса выполнения файла.

18. Система по п.16, в которой обработкой файла является вычисление свертка файла.

19. Система по п.15, в которой правилом категоризации является правило для обнаружения вредоносного программного обеспечения.

20. Система по п.15, в которой правилом категоризации является свертка файла, которая определяет, входил ли файл в категорию файлов с совпадающим значением свертки.

21. Система по п.15, в которой дополнительно используется средство обучения алгоритмов, связанное со средством определения надежности и предназначенное для обучения алгоритмов интеллектуального анализа данных, используемых средством определения надежности.

22. Система по п.21, в которой для обучения алгоритмов интеллектуального анализа данных используется множество файлов для обучения, а также статистика использования правил, применение которых к множеству файлов для обучения разбивает указанное множество файлов на категории таким образом, что хотя бы одна категория файлов в соответствии с правилом категоризации представляла собой однородное множество файлов, которое состоит только из похожих файлов.

23. Система по п.22, в которой похожими файлами считают файлы, степень сходства между которыми превышает заранее установленный порог.

24. Система по п.23, в которой степень сходства между файлами определяют на основании степени сходства данных, хранящихся в файлах.

25. Система по п.23, в которой степень сходства между файлами определяют на основании степени сходства функционала файлов.

26. Система по п.25, в которой в качестве функционала файла используют журнал вызовов API-функций операционной системы при эмуляции исполнения файла.

27. Система по п.23, в которой степень сходства определяют в соответствии с одной из метрик: Хэмминга, Левенштейна, Жаккара, Дайса.

28. Система по п.15, в которой средство определения надежности для определения степени надежности правила категоризации использует алгоритмы иерархической кластеризации, нечеткой кластеризации, алгоритм минимально покрывающего дерева.