stochasticLogisticRegression
stochasticLinearRegression, и работает так же.
Использование
Функция используется в два этапа:
- Обучение
train_data.
Количество параметров не фиксировано: оно зависит только от числа аргументов, переданных в logisticRegressionState.
Все они должны быть числовыми значениями.
Обратите внимание, что столбец с целевым значением (которое мы хотим научиться предсказывать) передаётся как первый аргумент.
Предсказанные метки должны находиться в диапазоне [-1, 1].
- Предсказание
1.
evalMLMethod — это объект AggregateFunctionState, а далее идут столбцы признаков.
Мы также можем задать порог вероятности, который относит элементы к разным меткам.
test_data — это таблица, как и train_data, но она может не содержать целевое значение.
Синтаксис
learning_rate— Коэффициент длины шага при выполнении шага градиентного спуска. Слишком высокая скорость обучения может привести к бесконечным значениям весов модели. Значение по умолчанию —0.00001.Float64l2_regularization_coef— Коэффициент L2-регуляризации, который может помочь предотвратить переобучение. Значение по умолчанию —0.1.Float64mini_batch_size— Задаёт количество элементов, для которых вычисляются и суммируются градиенты для выполнения одного шага градиентного спуска. При чистом стохастическом спуске используется один элемент, однако небольшие батчи (около 10 элементов) делают шаги градиентного спуска более стабильными. Значение по умолчанию —15.UInt64method— Метод обновления весов:Adam(по умолчанию),SGD,Momentum,Nesterov.MomentumиNesterovтребуют немного больше вычислений и памяти, однако могут быть полезны с точки зрения скорости сходимости и стабильности методов стохастического градиента.Stringtarget— Целевые метки бинарной классификации. Должны находиться в диапазоне [-1, 1].Floatx1, x2, ...— Значения признаков (независимые переменные). Все должны быть числовыми.Float
evalMLMethod, который возвращает вероятности того, что объект имеет метку 1. Array(Float64)
Примеры
Обучение модели
Query
Response
Query
Response
Query
Response