• Как вы импортируете функцию для кросс-валидации?

Ответы 1

  • Обычно в процессе машинного обучения данные делятся на обучающие и тестовые наборы; затем обучающий набор используется для обучения модели, а тестовый набор-для оценки производительности модели. Однако такой подход может привести к проблемам дисперсии. Проще говоря, проблема дисперсии относится к сценарию, в котором наша точность, полученная на одном тесте, сильно отличается от точности, полученной на другом тестовом наборе с использованием того же алгоритма.

    Решение этой проблемы заключается в использовании K-кратной перекрестной проверки для оценки производительности, где K-любое число. Процесс K-кратной перекрестной проверки прост. Вы делите данные на K складок. Из K складок наборы K-1 используются для обучения, в то время как остальные наборы используются для тестирования. Алгоритм обучается и тестируется K раз, каждый раз новый набор используется в качестве тестового набора, а остальные наборы используются для обучения. Наконец, результатом K-кратной перекрестной проверки является среднее значение результатов, полученных на каждом наборе.

    Предположим, мы хотим выполнить 5-кратную перекрестную проверку. Для этого данные делятся на 5 наборов, например, мы называем их НАБОРОМ A, НАБОРОМ B, НАБОРОМ C, НАБОРОМ D и НАБОРОМ E. Алгоритм обучается и тестируется K раз. В первом сгибе НАБОР A и НАБОР D используются в качестве обучающего набора, а НАБОР E используется в качестве тестового набора

  • Добавить свой ответ

Еще вопросы

Войти через Google

или

Забыли пароль?

У меня нет аккаунта, я хочу Зарегистрироваться

How much to ban the user?
1 hour 1 day 100 years