大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 59 人工智能AI行业报告
相较感知机,多层感知机主要进行了如下改进: 1)解决了感知机的二元分类问题:引入隐藏层,并采用非线性激活函数 Sigmoid 代替阶跃函数,使得神经网络可以对非线性函数进行拟合。 2)可进行多元分类任务:多层感知机拓宽了输出层宽度。 多层感知机的发展受到算力限制。由于多层感知机是全连接神经网络,所 需算力随着神经元的增加呈几何增长。而在算力相对匮乏 20 世纪 80 年代, 算力瓶颈阻碍了多层感知机的进一步发展。1986 年,Hinton 提出了一种适用于多层感知机训练的反向传播算法——BP 算 法,至今仍是神经网络训练的主流算法。 BP 算法的核心思想为:将输出值与标记值进行比较,误差反向由输出层向 输入层传播,在这个过程中利用梯度下降算法对神经元的权重进行调整。 BP 算法最大的问题在于梯度不稳定。由于当时 Sigmod、Tanh 作为非线 性激活函数应用广泛,而这两种激活函数都存在一定范围内梯度过大或过 小的问题。神经网络停留在浅层时,连乘次数少、梯度较为稳定;而当神 经网络向深层迈进,梯度的不稳定性加剧,使得深层神经网络无法正常训 练。
多层感知机的出现奠定了神经网络的基本结构,也使得神经网络的应用范围不 再局限于图像识别,而是向自然语言处理、语音识别等其他领域拓展。由于各 个领域的任务具有不同特点,神经网络产生了众多分支模型。这一阶段分支网 络探索各自领域的任务特点,通过机制创新使神经网络获得对应的特征提取能 力。 3.1 图像识别领域:“卷积”机制提取图像空间特征 人类在进行图像识别时,能够从细小的特征推理得知事物的全貌,即“窥一斑 而见全豹”。在多层感知机时代,由于二维图像被转化为一维向量后输入模型, 因此丢失了图像的空间特征信息。为了使神经网络获得从特征到全局的图像识 别能力,卷积神经网络应运而生。 1998 年,LeNet 卷积神经网络(CNN)首次应用于图像分类。CNN 通过多个 卷积层对特征进行提取和压缩,得到较为可靠的高层次特征,最终输出的特征 可应用于图像分类等任务。人类在进行文字阅读、语音识别时,不仅会关注当前看到、听到的词句,还会 联系上下文进行辅助理解。在多层感知机时代,所有的输入彼此独立,模型仅 针对当前词句进行训练,而不关注前后信息,造成了时序信息的丢失。 为了使神经网络获得时序信息提取能力,1986 年循环神经网络(RNN)被提 出,将循环思想引入神经网络。在 RNN 中,每个神经元既接受当前时刻输入 信息、也接受上一时刻神经元的输出信息,使神经网络具备了时序特征提取能力。
标签: 人工智能AI行业报告
相关文章
大型语言模型是生成或嵌入式文本的基础模型 (一种大型神经网络)。它们生成的文本可以通过为其 提供起点或“提示”来进行调节,从而使其能够用自然 语言或代...
2025-01-17 59 人工智能AI行业报告
大模型快速发展,网信办数据显示,截至2024年7月30日,全国范围内通过登记备案的行业大模型有136款,占比达69%。行业大 模型深度赋能教育、金融、...
2025-01-08 76 人工智能AI行业报告
生成式AI也在加速赋能广告制作环节。今年业绩和股价爆发的AppLovin和汇量科技,主要关注的是决策式 AI在程序化广告平台的技术突破,提升广告投放精...
2025-01-06 105 人工智能AI行业报告
纵观历史50年,五次半导体市场规模迅猛成长均伴随爆款电子产品的普及。自1976年起,全球半导体市场历经了5次迅猛成长,分别由台式电脑(1983~198...
2025-01-05 89 人工智能AI行业报告
先进封装:受AI芯片大面积需求带动,2.5D先进封装于2023至2024年供不应 求情况明显,据TrendForce预估,2025年晶圆代工厂配套提供...
2025-01-05 97 人工智能AI行业报告
针对外贸 B2B 垂类场景的AI助手AI麦可:截至2024/6/30,购买AI麦可的会员共6095 位(不含试用体验包客户),较2024年一季度末增加...
2025-01-04 67 人工智能AI行业报告
最新留言