stochasticLogisticRegression
stochasticLinearRegression 相同的自定义参数,用法也完全相同。
用法
此函数的使用分为两步:
- 拟合
train_data 表中。
参数的数量不是固定的,它只取决于传递给 logisticRegressionState 的参数个数。
它们都必须是数值。
请注意,包含目标值 (也就是我们希望学习并预测的值) 的列会作为第一个参数插入。
预测标记必须位于 [-1, 1] 范围内。
- 预测
1 的概率。
evalMLMethod 的第一个参数是一个 AggregateFunctionState 对象,后面的参数是特征列。
我们还可以设置一个概率阈值,据此将元素分配到不同的标记。
test_data 是一个类似于 train_data 的表,但可以不包含目标值。
语法
learning_rate— 执行梯度下降时的步长系数。学习率过大可能会导致模型权重无限增大。默认值为0.00001。Float64l2_regularization_coef— L2 正则化系数,有助于防止过拟合。默认值为0.1。Float64mini_batch_size— 设置执行一次梯度下降时用于计算并累加梯度的元素数量。纯随机下降只使用一个元素,但使用较小的批次 (约 10 个元素) 会让梯度下降步骤更稳定。默认值为15。UInt64method— 权重更新方法:Adam(默认) 、SGD、Momentum、Nesterov。Momentum和Nesterov需要稍多一些计算和内存,但在随机梯度方法的收敛速度和稳定性方面通常更有帮助。Stringtarget— 目标二元分类标记。必须在 [-1, 1] 范围内。Floatx1, x2, ...— 特征值 (自变量) 。必须全部为数值类型。Float
evalMLMethod 进行预测,该方法会返回样本标记为 1 的概率。Array(Float64)
示例
训练模型
Query
Response
Query
Response
Query
Response