Поиск по сайту:

Отрасли в фокусе: машинное обучение для обнаружения угроз кибербезопасности

Угрозы кибербезопасности становятся все более сложными и многочисленными. Чтобы решить эти проблемы, отрасль обратилась к машинному обучению (МО) как к инструменту обнаружения киберугроз и реагирования на них.

Читать далее →

Изучение LightGBM: рост по листам с помощью GBDT и GOSS

LightGBM — это высокоэффективная система повышения градиента. Он завоевал популярность благодаря своей скорости и производительности, особенно при работе с большими и сложными наборами данных. Этот мощный алгоритм, разработанный Microsoft, известен своей уникальной способностью обрабатывать большие объемы данных с большей легкостью по сравнению с традиционными методами.

В этом посте мы поэкспериментируем с платформой LightGBM на наборе данных Ames Housing. В частности, мы прольем свет н

Читать далее →

7 проектов LLM для расширения вашего портфолио машинного обучения

Большие языковые модели (LLM) очень полезны в самых разных задачах. Создание приложений на базе LLM на первый взгляд может показаться довольно сложной задачей. Но все, что вам нужно, это:

Как настроить перекрестную проверку k-fold

Процедура k-кратной перекрестной проверки — это стандартный метод оценки производительности алгоритма машинного обучения на наборе данных.

Обычное значение для k — 10, но как узнать, подходит ли эта конфигурация для нашего набора данных и наших алгоритмов?

Один из подходов — изучить влияние различных значений k на оценку производительности модели и сравнить ее с идеальными условиями тестирования. Это может помочь выбрать подходящее значение для k.

Читать далее →

Повторная перекрестная проверка в k-кратном порядке для оценки модели в Python

Процедура k-кратной перекрестной проверки — это стандартный метод оценки производительности алгоритма или конфигурации машинного обучения в наборе данных.

Один запуск процедуры перекрестной проверки в k-кратном размере может привести к зашумленной оценке производительности модели. Различные разделения данных могут привести к очень разным результатам.

Повторная k-кратная перекрестная проверка позволяет улучшить расчетную производительность модели машинного обучения. Это включает в

Читать далее →

Как использовать XGBoost для прогнозирования временных рядов

XGBoost — это эффективная реализация повышения градиента для задач классификации и регрессии.

Он одновременно быстрый и эффективный, хорошо, если не лучший, справляется с широким спектром задач прогнозного моделирования и является фаворитом среди победителей конкурсов по науке о данных, например, на Kaggle.

XGBoost также можно использовать для прогнозирования временных рядов, хотя для этого требуется, чтобы набор данных временных рядов сначала был преобразован в контролируемую зад

Читать далее →

Многоклассовая несбалансированная классификация

Несбалансированная классификация — это те задачи прогнозирования, в которых распределение примеров по меткам классов неравномерно.

Большинство примеров несбалансированной классификации сосредоточены на задачах двоичной классификации, однако многие инструменты и методы несбалансированной классификации также напрямую поддерживают задачи многоклассовой классификации.

В этом уроке вы узнаете, как использовать инструменты несбалансированной классификации с многоклассовым набором данных

Читать далее →

Как использовать визуализацию данных Seaborn для машинного обучения

Визуализация данных дает представление о распределении и взаимосвязях между переменными в наборе данных.

Это понимание может быть полезным при выборе методов подготовки данных, которые будут применяться перед моделированием, а также типов алгоритмов, которые могут наиболее подходить для данных.

Seaborn — это библиотека визуализации данных для Python, которая работает поверх популярной библиотеки визуализации данных Matplotlib, но обеспечивает простой интерфейс и эстетически более

Читать далее →

Нежное введение в теорию вычислительного обучения

Теория вычислительного обучения или статистическая теория обучения относятся к математическим основам для количественной оценки задач и алгоритмов обучения.

Это подобласти машинного обучения, которые специалисту по машинному обучению не обязательно знать глубоко, чтобы добиться хороших результатов в решении широкого круга задач. Тем не менее, это подобласть, в которой глубокое понимание некоторых из наиболее известных методов может дать понимание более широкой задачи обучения на данных.

Читать далее →

Постройте поверхность принятия решений для алгоритмов машинного обучения в Python

Алгоритмы классификации учатся назначать метки классов примерам, хотя их решения могут показаться непрозрачными.

Популярной диагностикой для понимания решений, принимаемых алгоритмом классификации, является поверхность решений. Это график, показывающий, как алгоритм подходящего машинного обучения прогнозирует грубую сетку во входном пространстве объектов.

График поверхности решений — это мощный инструмент для понимания того, как данная модель «видит» зада

Читать далее →