Добро пожаловать обратно, мои начинающие кибервоины!
По мере того, как наш цифровой мир движется к тому, что аналитика данных и искусственный интеллект становятся ключевыми компонентами любой стратегии кибербезопасности, становится всё более важным, чтобы вы понимали эти методы, чтобы оставаться востребованными и востребованными в самой увлекательной и высокооплачиваемой сфере ИТ. С этой целью мы в Hackers-Arise предлагаем новый курс по аналитике данных в кибербезопасности. Это будет первый из нескольких курсов по этой теме, которые выведут вас на передний план кибербезопасности.
В науке о данных существует доминирующий язык программирования, который носит очень простое название R. Когда IT-рекрутеров спрашивают, какими языками программирования они хотят, чтобы владели их потенциальные кандидаты, на первом месте стоит Python, а на втором — R.
В этом уроке мы познакомим вас с R, но для более полного понимания R и аналитики науки о данных в кибербезопасности запишитесь на эти курсы в нашей программе Subscriber Pro.
R — это язык программирования, разработанный специально для науки о данных и графического анализа. Он широко применяется в статистическом выводе, анализе данных и машинном обучении (МО).
Одно из ключевых преимуществ R в кибербезопасности — его способность обрабатывать ОЧЕНЬ большие наборы данных. В кибербезопасности мы часто работаем с огромными наборами данных, которые могут включать:
R предназначен для эффективной и производительной обработки больших объемов данных.
Кроме того, R можно использовать в кибербезопасности для таких задач, как сетевой анализ, обнаружение вторжений, обнаружение спама, анализ журналов, анализ событий на компьютере и многое другое. Его также можно использовать для тестирования на взлом/проникновение, поскольку он способен обнаруживать уязвимости и, в некоторых случаях, пытаться эксплойтить их.
Давайте начнем изучать R и его применение в кибербезопасности!
Вы можете загрузить R из проекта r-project по адресу http://cran.r-project.org или, если вы используете Kali Linux, вы можете просто загрузить пакет из репозитория, введя:
kali > sudo apt install r-base
Последняя версия — R-4.4.2
Как и в случае с большинством языков программирования, вам, вероятно, понадобится интегрированная среда разработки (IDE) для облегчения написания кода. Такие IDE могут значительно повысить вашу эффективность при написании эффективного кода. Для R лучшей IDE является R Studio.
Вы можете скачать R-Studio по ссылке ниже.
https://posit.co/downloads/
Теперь мы готовы начать использовать R!
Чтобы запустить r-studio, просто введите:
кали > ./rstudio
После этого вы должны увидеть консоль, как на снимке экрана выше.
Теперь, когда R-Studio установлен и запущен, мы можем приступить к вводу некоторых простых команд и знакомству с синтаксисом R.
В консоли R-Studio вы просто вводите команды в строке «>» и нажимаете клавишу Enter, чтобы система обработала их. Впрочем, это ничем не отличается от Linux или Python.
Чтобы напечатать текст, мы можем ввести команду печати , а затем (”, а затем текст, который мы хотим напечатать, и закрыть его “), например:
/> печать («R необходим для науки о данных в кибербезопасности»)
Как вы можете видеть выше, консоль напечатала текст между (” и “) в функции печати.
В некоторых случаях нам может понадобиться сохранить этот текст в переменной. Мы можем сделать это.
Создавая переменную и направляя текст в переменную ( в Linux для направления данных используются как символы <, так и >. В R то же самое). Давайте создадим переменную с именем « essential » и направим наше выражение в эту переменную. Для направления текста в переменную можно использовать <-.
/>необходимо <-«R необходим для науки о данных в кибербезопасности»)
/> печать (обязательно)
[1] «R имеет решающее значение для науки о данных в кибербезопасности»
Теперь каждый раз, когда вы дадите команду консоли вывести необходимую переменную, она будет выводить этот оператор.
Теперь давайте рассмотрим несколько простых математических операций в R. Допустим, нам нужно умножить два числа. Мы можем ввести:
/> 3 * 3
Если мы хотим использовать показатель степени (возведенный в степень), мы используем символ ^ , например:
/> 3 ^ 3
Если мы хотим сложить два числа
/> 3 + 3
Если мы хотим вычесть одно число из другого
/> 3- 3
Если мы хотим сохранить результаты математической операции в переменной с именем «threecube»,
/> трикуба <- 3 ^ 3
Затем мы можем распечатать эту переменную, используя оператор печати с именем переменной, заключенным в ( ).
/> печать (трикуба)
Затем, если вы посмотрите на правый верхний угол нашей студии R, вы увидите список созданных нами глобальных переменных.
Одним из ключевых элементов науки о данных является визуализация данных. Изображения могут заменить тысячу слов или, если уж на то пошло, тысячу точек данных. Визуализация помогает читателю отчёта лучше и полнее понять результаты, чем любая таблица или необработанные данные. Визуализация — одна из сильных сторон R.
Представим, что мы отслеживаем атаки на некоторые из наших хостов во внутренней сети. Первым делом создадим переменную x и перенаправим в неё IP-адреса этих систем (хотя IP-адреса выглядят как числа, нам нужно обрабатывать их как строки текста, как в Python).
Далее нам необходимо создать переменную y и направить в нее значения количества атак на каждый из этих хостов.
Наконец, нам нужно использовать функцию barplot для создания столбчатой диаграммы, которая отображает каждый IP-адрес на нижней оси или оси x, а количество атак — на вертикальной оси или оси y.
Как вы можете видеть ниже, r-studio сгенерировала красивый график, показывающий нам количество атак на каждую систему!
Обратите внимание, что на нижней оси (оси X) не все данные были напечатаны из-за нехватки места. Это можно исправить, просто нажав кнопку масштабирования в левом верхнем углу графика. При этом гистограмма отобразится в увеличенном формате, и на ней будут отображены все IP-адреса.
Как и в случае с любым языком программирования, при работе с R вам, скорее всего, иногда понадобится помощь. R-Studio имеет мощный справочный механизм, который может ответить на большинство ваших вопросов.
Например, если вам нужна помощь в понимании того, как работает функция sqrt (квадратный корень), вы можете просто ввести ? , а затем sqrt, как показано ниже.
R-Studio отреагирует, предложив экран справки в правом нижнем окне, как показано ниже.
Кроме того, вы можете использовать ключевое слово help , за которым следует имя функции, как показано ниже.
/>помощь (sqrt)
Это также предоставит вам тот же экран справки, который показан выше.
Кибербезопасность стремительно развивается, превращаясь в науку, поддающуюся количественной оценке. Наука о данных, машинное обучение и искусственный интеллект станут критически важными в этой области в ближайшие месяцы и годы. Язык программирования R — лучший выбор для специалистов по данным и рекрутеров, ищущих работу в этой быстрорастущей области.
По мере того, как наш цифровой мир движется к тому, что аналитика данных и искусственный интеллект становятся ключевыми компонентами любой стратегии кибербезопасности, становится всё более важным, чтобы вы понимали эти методы, чтобы оставаться востребованными и востребованными в самой увлекательной и высокооплачиваемой сфере ИТ. С этой целью мы в Hackers-Arise предлагаем новый курс по аналитике данных в кибербезопасности. Это будет первый из нескольких курсов по этой теме, которые выведут вас на передний план кибербезопасности.
В науке о данных существует доминирующий язык программирования, который носит очень простое название R. Когда IT-рекрутеров спрашивают, какими языками программирования они хотят, чтобы владели их потенциальные кандидаты, на первом месте стоит Python, а на втором — R.
В этом уроке мы познакомим вас с R, но для более полного понимания R и аналитики науки о данных в кибербезопасности запишитесь на эти курсы в нашей программе Subscriber Pro.
Что такое R?
R — это язык программирования, разработанный специально для науки о данных и графического анализа. Он широко применяется в статистическом выводе, анализе данных и машинном обучении (МО).
Почему R в кибербезопасности?
Одно из ключевых преимуществ R в кибербезопасности — его способность обрабатывать ОЧЕНЬ большие наборы данных. В кибербезопасности мы часто работаем с огромными наборами данных, которые могут включать:
- Сетевой трафик
- Вредоносное ПО
- Веб-приложения
- Программное обеспечение
- электронная почта
- Двоичные файлы
- пароли
- ботнеты
- вредоносные URL-адреса
- Наборы данных атак SCADA/ICS
- хеши
- Правила ЯРА
R предназначен для эффективной и производительной обработки больших объемов данных.
Кроме того, R можно использовать в кибербезопасности для таких задач, как сетевой анализ, обнаружение вторжений, обнаружение спама, анализ журналов, анализ событий на компьютере и многое другое. Его также можно использовать для тестирования на взлом/проникновение, поскольку он способен обнаруживать уязвимости и, в некоторых случаях, пытаться эксплойтить их.
Давайте начнем изучать R и его применение в кибербезопасности!
Шаг № 1: Загрузите и установите R
Вы можете загрузить R из проекта r-project по адресу http://cran.r-project.org или, если вы используете Kali Linux, вы можете просто загрузить пакет из репозитория, введя:
kali > sudo apt install r-base
Последняя версия — R-4.4.2
Как и в случае с большинством языков программирования, вам, вероятно, понадобится интегрированная среда разработки (IDE) для облегчения написания кода. Такие IDE могут значительно повысить вашу эффективность при написании эффективного кода. Для R лучшей IDE является R Studio.
Вы можете скачать R-Studio по ссылке ниже.
https://posit.co/downloads/
Теперь мы готовы начать использовать R!
Чтобы запустить r-studio, просто введите:
кали > ./rstudio
После этого вы должны увидеть консоль, как на снимке экрана выше.
Теперь, когда R-Studio установлен и запущен, мы можем приступить к вводу некоторых простых команд и знакомству с синтаксисом R.
Шаг № 2: Некоторые простые функции и переменные в R
В консоли R-Studio вы просто вводите команды в строке «>» и нажимаете клавишу Enter, чтобы система обработала их. Впрочем, это ничем не отличается от Linux или Python.
Чтобы напечатать текст, мы можем ввести команду печати , а затем (”, а затем текст, который мы хотим напечатать, и закрыть его “), например:
/> печать («R необходим для науки о данных в кибербезопасности»)
Как вы можете видеть выше, консоль напечатала текст между (” и “) в функции печати.
В некоторых случаях нам может понадобиться сохранить этот текст в переменной. Мы можем сделать это.
Создавая переменную и направляя текст в переменную ( в Linux для направления данных используются как символы <, так и >. В R то же самое). Давайте создадим переменную с именем « essential » и направим наше выражение в эту переменную. Для направления текста в переменную можно использовать <-.
/>необходимо <-«R необходим для науки о данных в кибербезопасности»)
/> печать (обязательно)
[1] «R имеет решающее значение для науки о данных в кибербезопасности»
Теперь каждый раз, когда вы дадите команду консоли вывести необходимую переменную, она будет выводить этот оператор.
Шаг № 3: Простая математика в R
Теперь давайте рассмотрим несколько простых математических операций в R. Допустим, нам нужно умножить два числа. Мы можем ввести:
/> 3 * 3
Если мы хотим использовать показатель степени (возведенный в степень), мы используем символ ^ , например:
/> 3 ^ 3
Если мы хотим сложить два числа
/> 3 + 3
Если мы хотим вычесть одно число из другого
/> 3- 3
Если мы хотим сохранить результаты математической операции в переменной с именем «threecube»,
/> трикуба <- 3 ^ 3
Затем мы можем распечатать эту переменную, используя оператор печати с именем переменной, заключенным в ( ).
/> печать (трикуба)
Затем, если вы посмотрите на правый верхний угол нашей студии R, вы увидите список созданных нами глобальных переменных.
Шаг № 3: Визуализация
Одним из ключевых элементов науки о данных является визуализация данных. Изображения могут заменить тысячу слов или, если уж на то пошло, тысячу точек данных. Визуализация помогает читателю отчёта лучше и полнее понять результаты, чем любая таблица или необработанные данные. Визуализация — одна из сильных сторон R.
Представим, что мы отслеживаем атаки на некоторые из наших хостов во внутренней сети. Первым делом создадим переменную x и перенаправим в неё IP-адреса этих систем (хотя IP-адреса выглядят как числа, нам нужно обрабатывать их как строки текста, как в Python).
Далее нам необходимо создать переменную y и направить в нее значения количества атак на каждый из этих хостов.
Наконец, нам нужно использовать функцию barplot для создания столбчатой диаграммы, которая отображает каждый IP-адрес на нижней оси или оси x, а количество атак — на вертикальной оси или оси y.
Как вы можете видеть ниже, r-studio сгенерировала красивый график, показывающий нам количество атак на каждую систему!
Обратите внимание, что на нижней оси (оси X) не все данные были напечатаны из-за нехватки места. Это можно исправить, просто нажав кнопку масштабирования в левом верхнем углу графика. При этом гистограмма отобразится в увеличенном формате, и на ней будут отображены все IP-адреса.
Шаг № 4. Получение справки в R Studio
Как и в случае с любым языком программирования, при работе с R вам, скорее всего, иногда понадобится помощь. R-Studio имеет мощный справочный механизм, который может ответить на большинство ваших вопросов.
Например, если вам нужна помощь в понимании того, как работает функция sqrt (квадратный корень), вы можете просто ввести ? , а затем sqrt, как показано ниже.
R-Studio отреагирует, предложив экран справки в правом нижнем окне, как показано ниже.
Кроме того, вы можете использовать ключевое слово help , за которым следует имя функции, как показано ниже.
/>помощь (sqrt)
Это также предоставит вам тот же экран справки, который показан выше.
Краткое содержание
Кибербезопасность стремительно развивается, превращаясь в науку, поддающуюся количественной оценке. Наука о данных, машинное обучение и искусственный интеллект станут критически важными в этой области в ближайшие месяцы и годы. Язык программирования R — лучший выбор для специалистов по данным и рекрутеров, ищущих работу в этой быстрорастущей области.