AI:如何训练机器学习的模型-巨人网络通讯

AI:如何训练机器学习的模型

1.Training: 如何训练模型

一句话理解机器学习一般训练过程：通过有标签样本来调整（学习）并确定所有权重Weights和偏差Bias的理想值。

训练的目标：最小化损失函数

（损失函数下面马上会介绍）

机器学习算法在训练过程中，做的就是：检查多个样本并尝试找出可最大限度地减少损失的模型；目标就是将损失(Loss)最小化

上图就是一般模型训练的一般过程（试错过程），其中

模型：将一个或多个特征作为输入，然后返回一个预测 (y') 作为输出。为了进行简化，不妨考虑一种采用一个特征并返回一个预测的模型，如下公式（其中b为 bias，w为weight）

计算损失：通过损失函数，计算该次参数（bias、weight）下的loss。
计算参数更新：检测损失函数的值，并为参数如bias、weight生成新值，以降低损失为最小。

例如：使用梯度下降法，因为通过计算整个数据集中w每个可能值的损失函数来找到收敛点这种方法效率太低。所以通过梯度能找到损失更小的方向，并迭代。

举个TensorFlow代码栗子，对应上面公式在代码中定义该线性模型：

y_output = tf.multiply(w,x) + b

假设该模型应用于房价预测，那么y_output为预测的房价，x为输入的房子特征值（如房子位置、面积、楼层等）

2. Loss Function:损失和损失函数

损失是一个数值表示对于单个样本而言模型预测的准确程度。

如果模型的预测完全准确，则损失为零，否则损失会较大。

训练模型的目标是从所有样本中找到一组平均损失“较小”的权重和偏差。

损失函数的目标：准确找到预测值和真实值的差距

如图红色箭头表示损失，蓝线表示预测。明显左侧模型的损失较大；右侧模型的损失较小

要确定loss，模型必须定义损失函数 loss function。例如，线性回归模型通常将均方误差用作损失函数，而逻辑回归模型则使用对数损失函数。

正确的损失函数，可以起到让预测值一直逼近真实值的效果，当预测值和真实值相等时，loss值最小。

举个TensorFlow代码栗子，在代码中定义一个损失loss_price 表示房价预测时的loss，使用最小二乘法作为损失函数：

loss_price = tr.reduce_sum(tf.pow(y_real - y_output), 2)

这里，y_real是代表真实值，y_output代表模型输出值（既上文公式的y' ），因为有的时候这俩差值会是负数，所以会对误差开平方，具体可以搜索下最小二乘法公式

3. Gradient Descent:梯度下降法

理解梯度下降就好比在山顶以最快速度下山：

好比道士下山，如何在一座山顶上，找到最短的路径下山，并且确定最短路径的方向

原理上就是凸形问题求最优解，因为只有一个最低点；即只存在一个斜率正好为 0 的位置。这个最小值就是损失函数收敛之处。

通过计算整个数据集中每个可能值的损失函数来找到收敛点这种方法效率太低。我们来研究一种更好的机制，这种机制在机器学习领域非常热门，称为梯度下降法。

梯度下降法的目标：寻找梯度下降最快的那个方向

梯度下降法的第一个阶段是为选择一个起始值（起点）。起点并不重要；因此很多算法就直接将设为 0 或随机选择一个值。下图显示的是我们选择了一个稍大于 0 的起点：

然后，梯度下降法算法会计算损失曲线在起点处的梯度。简而言之，梯度是偏导数的矢量；它可以让您了解哪个方向距离目标“更近”或“更远”。请注意，损失相对于单个权重的梯度（如图所示）就等于导数。

请注意，梯度是一个矢量，因此具有以下两个特征：

方向
大小

梯度始终指向损失函数中增长最为迅猛的方向。梯度下降法算法会沿着负梯度的方向走一步，以便尽快降低损失

为了确定损失函数曲线上的下一个点，梯度下降法算法会将梯度大小的一部分与起点相加

然后，梯度下降法会重复此过程，逐渐接近最低点。（找到了方向）

随机梯度下降法SGD：解决数据过大，既一个Batch过大问题，每次迭代只是用一个样本（Batch为1），随机表示各个batch的一个样本都是随机选择。

4. Learning Rate:学习速率

好比上面下山问题中，每次下山的步长。

因为梯度矢量具有方向和大小，梯度下降法算法用梯度乘以一个称为学习速率（有时也称为步长）的标量，以确定下一个点的位置。这是超参数，用来调整AI算法速率

例如，如果梯度大小为 2.5，学习速率为 0.01，则梯度下降法算法会选择距离前一个点 0.025 的位置作为下一个点。

超参数是编程人员在机器学习算法中用于调整的旋钮。大多数机器学习编程人员会花费相当多的时间来调整学习速率。如果您选择的学习速率过小，就会花费太长的学习时间：

继续上面的栗子，实现梯度下降代码为：

train_step = tf.train.GradientDescentOptimizer(0.025).minimize(loss_price)

这里设置梯度下降学习率为0.025, GradientDescentOptimizer()就是使用的随机梯度下降算法，而loss_price是由上面的损失函数获得的loss

至此有了模型、损失函数以及梯度下降函数，就可以进行模型训练阶段了：

Session = tf.Session()
Session.run(init)
for _ in range(1000):
	Session.run(train_step, feed_dict={x:x_data, y:y_data})

这里可以通过for设置固定的training 次数，也可以设置条件为损失函数的值低于设定值，

x_data y_data则为训练所用真实数据，x y 是输入输出的placeholder（代码详情参见TensorFlow API文档）

5. 扩展：BP神经网络训练过程

BP（BackPropagation）网络的训练，是反向传播算法的过程，是由数据信息的正向传播和误差Error的反向传播两个过程组成。

反向传播算法是神经网络算法的核心，其数学原理是：链式求导法则

正向传播过程：

输入层通过接收输入数据，传递给中间层（各隐藏层）神经元，每一个神经元进行数据处理变换，然后通过最后一个隐藏层传递到输出层对外输出。

反向传播过程：

正向传播后通过真实值和输出值得到误差Error，当Error大于设定值，既实际输出与期望输出差别过大时，进入误差反向传播阶段：

Error通过输出层，按照误差梯度下降的方式，如上面提到的随机梯度下降法SGD，反向修正各层参数（如Weights），向隐藏层、输入层逐层反转。

通过不断的正向、反向传播，直到输出的误差减少到预定值，或到达最大训练次数。

到此这篇关于AI:如何训练机器学习的模型的文章就介绍到这了,相信对你有所帮助，更多相关机器学习内容请搜索脚本之家以前的文章或继续浏览下面的相关文章，希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

使用JavaSE来模拟斗地主
用python做个代码版的小仙女蹦迪视频
详细过程带你用Python做车牌自动识别系统
用Python做个个性的动画挂件让桌面不单调
Python做个自定义动态壁纸还可以放视频
自己用python做的一款超炫酷音乐播放器
我用Python做个AI出牌器斗地主把把赢

上一篇：python 用递归实现通用爬虫解析器
下一篇：Python实现Telnet自动连接检测密码的示例

AI:如何训练机器学习的模型

目录 1.Training: 如何训练模型 2. Loss Function:损失和损失函数 3. Gradient Descent:梯度下降法 4. Learning Rate:学习速率 5. 扩展：BP神经网络训练过程 1.Training: 如何训练模型一句话理解机器学习一如何,训练,机器,学习,的,...

物联卡应用_雨淅物联：技术进步推动物联网提高传统产

2022年，物联网领域突破万亿市场，各种工业级和民用级智能设备层出不穷。物联网卡在...

目前电销卡封号应该怎么解决

目前电销卡封号应该怎么解决许多做电销行业的朋友问我怎么用电销卡才能更稳定。销...

400电话提升企业品牌形象和广告效果

很多企业喜欢在广告中添加400电话，这是因为400电话能大幅度提高广告的效果，显著提...

免费网页在线客服系统代码哪里有，能用吗?

网络资源为众多企业门户网站、APP、以及公众号，提供了庞大的访问量。在海量的IP流...

包头市电话机器人（包头机器人培训机构比较好的都有哪

本文目录一览：1、电销机器人打电话违法吗2、智能外呼就是机器人打电话吗?3、机器人...

廊坊电话机器人代劳电销机器人

汇港通科技组装于2018年，是一家潜心于大中小企业精准经营销售和企业管理效劳处置计...

宁波电商呼叫中心系统办理多少钱,外呼机器人费用-了解

一企嗨电话营销系统 1．当前的电销场景有哪些困扰？ 1）手机.卡频繁被封，电销业务...

微信公众号代运营的价位坑不坑？

想必现在大部分的企业或商家关于微信开发的第一印象差不多便是一个微信商场的感觉...

呼叫中心运营绩效最佳化方案

Envision 座席员绩效优化方案美国Envision公司所提供之Call Center Performance Suite“呼叫中心...

宁波不封号的回拨电销系统报价,电销AXB系统-原来在这里

一企嗨电话营销系统 1．当前的电销场景有哪些困扰？ 1）手机.卡频繁被封，电销业务...

客服中的“100－1＝0”

回顾近三年来的点点滴滴，在10000号的工作阅历让我懂得了客户服务中“100－1＝0”的硬...

信用卡电销权益（办信用卡电销话术）

本文目录一览：1、工商银行信用卡电销能挣到钱吗2、信用卡的权益有哪些3、深圳中信...

你觉得秦腔艺术的特点和作用各是什么？

秦腔唱腔包括“板路”和“彩腔”两部分度言外呼系统，每部分均有欢音和苦音之分。...

居然是电话机器人的英文（电话机器人是什么东西?）

本文目录一览：1、电话机器人怎么样？2、英语翻译成汉语3、打电话的机器人?4、电话...

外包电销团队可行不（电销外包公司的薪酬）

本篇文章给我们谈谈外包电销团队可行不，以及电销外包公司的薪酬对应的知识点，期...

AI:如何训练机器学习的模型

全 部 栏 目

目录

1.Training: 如何训练模型

2. Loss Function:损失和损失函数

3. Gradient Descent:梯度下降法

4. Learning Rate:学习速率

5. 扩展：BP神经网络训练过程

全部栏目