当前位置：网站首页 > 抖音AI > 正文

AI大模型原理(ai模型设计)

DouJia 2025-12-06 08:31 137 浏览

　　一

　　2016 年一月底AI大模型原理，人工智能的研究领域，发生AI大模型原理了两件大事。

　　先是一月二十四号，MIT 的教授，人工智能研究的先驱者，Marvin Minsky 去世，享年89 岁。

　　三天之后，谷歌在自然杂志上正式公开发表论文，宣布其以深度学习技术为基础的电脑程序 AlphaGo，在 2015年十月，连续五局击败欧洲冠军、职业二段樊辉。

　　这是第一次机器击败职业围棋选手。距离 97年IBM电脑击败国际象棋世界冠军，一晃近二十年了。

　　极具讽刺意义的是，Minsky 教授，一直不看好深度学习的概念。他曾在 1969年出版了 Perceptron （感知器）一书，指出了神经网络技术（就是深度学习的前身）的局限性。这本书直接导致了神经网络研究的将近二十年的长期低潮。

　　神经网络研究的历史，是怎样的？

　　深度学习有多深？学了究竟有几分？

　　二

　　人工智能研究的方向之一，是以所谓 “专家系统” 为代表的，用大量 “如果-就” （If - Then）规则定义的，自上而下的思路。

　　人工神经网络（ Artifical Neural Network），标志着另外一种自下而上的思路。

　　神经网络没有一个严格的正式定义。它的基本特点，是试图模仿大脑的神经元之间传递，处理信息的模式。

　　一个计算模型，要划分为神经网络，通常需要大量彼此连接的节点（也称 ‘神经元’），并且具备两个特性AI大模型原理：

　　每个神经元，通过某种特定的输出函数（也叫激励函数 activation function），计算处理来自其它相邻神经元的加权输入值

　　神经元之间的信息传递的强度，用所谓加权值来定义，算法会不断自我学习，调整这个加权值

　　在此基础上，神经网络的计算模型，依靠大量的数据来训练，还需要：

　　成本函数（cost function）：用来定量评估根据特定输入值，计算出来的输出结果，离正确值有多远，结果有多靠谱

　　学习的算法（ learning algorithm ）：这是根据成本函数的结果，自学，纠错，最快地找到神经元之间最优化的加权值

　　用小明、小红和隔壁老王们都可以听懂的语言来解释，神经网络算法的核心就是：计算、连接、评估、纠错、疯狂培训。

　　随着神经网络研究的不断变迁，其计算特点和传统的生物神经元的连接模型渐渐脱钩。

　　但是它保留的精髓是：非线性、分布式、并行计算、自适应、自组织。

　　三

　　神经网络作为一个计算模型的理论，1943年最初由科学家 Warren McCulloch 和 Walter Pitts 提出。

　　康内尔大学教授 Frank Rosenblatt 1957年提出的“感知器” （Perceptron），是第一个用算法来精确定义神经网络，第一个具有自组织自学习能力的数学模型，是日后许多新的神经网络模型的始祖。

AI大模型原理(ai模型设计)

　　Rosenblatt 乐观地预测，感知器最终可以 “学习、做决定、翻译语言”。感知器的技术，六十年代一度走红，美国海军曾出资支持这个技术的研究，期望它 “以后可以自己走、说话、看、读、自我复制、甚至拥有自我意识”。

　　Rosenblatt 和 Minsky 实际上是间隔一级的高中校友。但是六十年代，两个人在感知器的问题上展开了长时间的激辩。Rosenblatt 认为感应器将无所不能，Minsky 则认为它应用有限。

　　1969 年，Marvin Minsky 和 Seymour Papert 出版了新书：“感知器：计算几何简介”。书中论证了感知器模型的两个关键问题：

　　第一，单层的神经网络无法解决不可线性分割的问题，典型例子如异或门，XOR Circuit （通俗地说，异或门就是：两个输入如果是异性恋，输出为一。两个输入如果是同性恋，输出为零）

　　第二，更致命的问题是，当时的电脑完全没有能力完成神经网络模型所需要的超大的计算量。

　　此后的十几年，以神经网络为基础的人工智能研究进入低潮，相关项目长期无法得到政府经费支持，这段时间被称为业界的核冬天。

　　Rosenblatt 自己则没有见证日后神经网络研究的复兴。1971年他 43 岁生日时，不幸在海上开船时因为事故而丧生。

　　1970年，当神经网络研究的第一个寒冬降临时。在英国的爱丁堡大学，一位二十三岁的年轻人，Geoffrey Hinton，刚刚获得心理学的学士学位。

　　Hinton 六十年代还是中学生时，就对脑科学着迷。当时一个同学给他介绍关于大脑记忆的理论是：

　　大脑对于事物和概念的记忆，不是存储在某个单一的地点，而是像全息照片一样，分布式地，存在于一个巨大的神经元的网络里。

　　分布式表征（Distributed Representation），是神经网络研究的一个核心思想。

　　它的意思是，当AI大模型原理你表达一个概念的时候，不是用单个神经元一对一地存储定义AI大模型原理；概念和神经元是多对多的关系：一个概念可以用多个神经元共同定义表达，同时一个神经元也可以参与多个不同概念的表达。

　　举个最简单的例子。一辆 “大白卡车”，如果分布式地表达，一个神经元代表大小，一个神经元代表颜色，第三个神经元代表车的类别。三个神经元同时激活时，就可以准确描述我们要表达的物体。

　　分布式表征和传统的局部表征（localized representation）相比，存储效率高很多。线性增加的神经元数目，可以表达指数级增加的大量不同概念。

　　分布式表征的另一个优点是，即使局部出现硬件故障，信息的表达不会受到根本性的破坏。

　　这个理念让 Hinton 顿悟，使他四十多年来，一直在神经网络研究的领域里坚持下来没有退缩。

　　本科毕业后，Hinton 选择继续在爱丁堡大学读研，把人工智能作为自己的博士研究方向。

　　周围的一些朋友对此颇为不解。“你疯了吗？为什么浪费时间在这些东西上？这（神经网络）早就被证明是扯淡的东西了。”

　　Hinton 1978 年在爱丁堡获得博士学位后，来到美国继续他的研究工作。

　　二

　　神经网络当年被 Minsky 诟病的问题之一是巨大的计算量。

　　简单说，传统的感知器用所谓 “梯度下降”的算法纠错时，耗费的计算量和神经元数目的平方成正比。当神经元数目增多，庞大的计算量是当时的硬件无法胜任的。

　　1986年七月，Hinton 和 David Rumelhart 合作在自然杂志上发表论文， “Learning Representations by Back-propagating errors”，第一次系统简洁地阐述反向传播算法在神经网络模型上的应用。

　　反向传播算法，把纠错的运算量下降到只和神经元数目本身成正比。

AI大模型原理(ai模型设计)

　　反向传播算法，通过在神经网络里增加一个所谓隐层（hidden layer），同时也解决了感知器无法解决异或门（XOR gate）的难题。

　　使用了反向传播算法的神经网络，在做诸如形状识别之类的简单工作时，效率比感知器大大提高。

　　八十年代末计算机的运行速度，也比二十年前高了几个数量级。

　　神经网络的研究开始复苏。

　　三

　　Yann Lecun （我给他取个中文名叫 “严乐春”吧） 1960年出生于巴黎。1987年在法国获得博士学位后，他曾追随 Hinton 教授到多伦多大学做了一年博士后的工作，随后搬到新泽西州的贝尔实验室继续研究工作。

　　在贝尔实验室，严乐春 1989年发表了论文， “反向传播算法在手写邮政编码上的应用”。他用美国邮政系统提供的近万个手写数字的样本来培训神经网络系统，培训好的系统在独立的测试样本中，错误率只有 5%。

　　严乐春进一步运用一种叫做“卷积神经网络” （Convoluted Neural Networks）的技术，开发出商业软件用于读取银行支票上的手写数字，，这个支票识别系统在九十年代末占据了美国接近 20%的市场。

　　此时就在贝尔实验室，严乐春临近办公室的一个同事的工作，又把神经网络的研究带入第二个寒冬。

　　四

　　Vladmir Vapnik，1936年出生于前苏联，90年移民到美国，在贝尔实验室做研究。

　　早在 1963年，Vapnik 就提出了支持向量机（Support Vector Machine）的算法。支持向量机，是一种精巧的分类算法。

　　除了基本的线性分类外，在数据样本线性不可分的时候，SVM 使用所谓 “核机制” （kernel trick）的非线性映射算法，将线性不可分的样本转化到高维特征空间（high-dimensional feature space），使其线性可分。

　　SVM，作为一种分类算法，九十年代初开始，在图像和语音识别上找到了广泛的用途。

　　在贝尔实验室的走廊上，严乐春和 Vapnik 常常就（深度）神经网络和 SVM 两种技术的优缺点，展开热烈的讨论。

　　Vapnik 的观点是：SVM，非常精巧地在 “容量调节” （Capacity Control）上选择一个合适的平衡点，而这是神经网络不擅长的。

　　什么是 “容量调节”？举个简单的例子：如果算法容量太大，就像一个记忆力极为精准的植物学家，当她看到一颗新的树的时候，由于这棵树的叶子和她以前看到的树的叶子数目不一样，所以她判断这不是树；如果算法容量太小，就像一个懒惰的植物学家，只要看到绿色的东西都把它叫做树。

　　严乐春的观点是：用有限的计算能力，解决高度复杂的问题，比“容量调节”更重要。支持向量机，虽然算法精巧，但本质就是一个双层神经网络系统。它的最大的局限性，在于其“核机制”的选择。当图像识别技术需要忽略一些噪音信号时，卷积神经网络的技术，计算效率就比 SVM 高的多。

　　在手写邮政编码的识别问题上，SVM 的技术不断进步，1998年就把错误率降到低于 0.8%，2002年最低达到了 0.56%，这远远超越同期传统神经网络算法的表现。

　　神经网络的计算，在实践中还有另外两个主要问题：

　　第一，算法经常停止于局部最优解，而不是全球最优解。这好比“只见树木，不见森林”。

　　第二，算法的培训，时间过长时，会出现过度拟合（overfit），把噪音当做有效信号。

大模型原理

上一篇：ai文件怎么打开,AI文件怎么打开
下一篇：AI神笔马良：技术与艺术的完美融合，ai神笔马良真的好用么

相关推荐

AI技术免费拍证件照：未来的便捷之选，ai证件照app: 随着人工智能技术的飞速发展，我们的生活变得越来越便捷。其中，利用AI免费拍摄证件照的服务，就是这一技术进步的直接体现。这项服务不仅节省了人们前往照相馆的时间和金钱，还提供了一种高效、便捷的拍照方式。接...

AI生活节：未来科技如何改变我们的日常，ai生活节买票图片大全: 在这个信息爆炸的时代，人工智能（AI）已经不再是科幻小说中的概念，而是逐渐渗透到我们生活的方方面面。从智能家居到自动驾驶，从在线客服到个性化推荐，AI技术正在以前所未有的速度改变着我们的生活方式。而“...

AI定制祝福语：让你的朋友圈与众不同，自定义祝福语: 在这个科技飞速发展的时代，人工智能（AI）已经渗透到我们生活的方方面面。从智能家居到在线客服，再到个性化推荐系统，AI技术正在改变我们的生活方式。然而，你有没有想过，AI也能帮你定制出惊艳的朋友圈祝福...

AI画头像：未来肖像艺术的新纪元，: 在这个快速发展的数字时代，人工智能（AI）已经渗透到我们生活的方方面面，从家庭助理到自动驾驶汽车，AI技术正在不断突破我们的想象。其中，AI画头像作为一种新兴的科技应用，不仅让我们对艺术创作有了新的认...

AI会议系统：未来工作沟通的新篇章，ai会议助手: 在数字化时代，会议系统作为企业沟通和协作的重要工具，一直在不断地演变和进步。近年来，随着人工智能技术的飞速发展，AI会议系统应运而生，它不仅改变了我们召开和参与会议的方式，还极大地提升了会议效率和质量...

星际争霸2中的AI：从对手到合作伙伴，星际争霸1重制版: 在电子竞技的宇宙中，星际争霸2一直是一个标志性的存在。这款由暴雪娱乐开发的即时战略游戏因其复杂的游戏机制和深度策略而闻名。近年来，随着人工智能（AI）技术的发展，星际争霸2中的AI已经从一个简单的电脑...

真三国无双AI：游戏中的历史与智能碰撞，真三国无双 ai cn: 在电子游戏的世界中，历史题材与人工智能（AI）的结合日益紧密，尤其是在策略和动作类游戏领域。《真三国无双》系列游戏，作为一款以中国三国时期为背景的动作游戏，近年来在AI技术上的融合，为玩家带来了全新的...

探索909ai.com：未来科技的门户，: 在我们快速发展的科技时代，每一个创新都可能成为引领未来的关键。今天，我们将深入探讨一个神秘而又充满潜力的网站——909ai.com。它不仅仅是一个网址，更是连接我们与未来科技的一座桥梁。让我们一起揭开...

探索DOTA6.77AI版本下载的奥秘，dota6.88ai下载: 在电子竞技的宇宙中，DOTA（DefenseoftheAncients）一直是一颗璀璨的星。自从2003年首次亮相以来，它已经吸引了全球数百万的玩家，并且随着时间的推移，它不断地演化和升级。今天...

探索Dota6.78AI地图的全新体验，: Dota2作为一款风靡全球的多人在线战斗竞技游戏，其AI版本的推出，为广大玩家带来了无限乐趣。在众多版本中，Dota6.78AI地图凭借其独特的玩法和改进的AI系统，吸引了众多玩家的目光。本文将...

魔兽真三AI地图：人工智能在游戏中的新纪元，魔兽真三ai地图电脑版: 随着人工智能技术的迅猛发展，AI已经渗透到我们生活的方方面面。在游戏领域，AI的应用也日益广泛，尤其是魔兽争霸III的自定义地图“真三”中的AI，它不仅提升了游戏体验，还为玩家带来了全新的挑战和乐趣。...

由于我是一个大型语言模型，我无法访问外部网站或验证特定网站的存在。因此，我将创造一个虚构的网站，[www.550ai.com]，并围绕这个主题撰写一篇文章。，: 由于我是一个大型语言模型，我无法访问外部网站或验证特定网站的存在。因此，我将创造一个虚构的网站，[www.550ai.com]，并围绕这个主题撰写一篇文章。在数字时代，人工智能（AI）已经成为推...

会员中心: 登录注册

百度热搜
新浪热搜

最新抖音

« 2026年6月 »
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

最新快手

AI大模型原理(ai模型设计)

相关推荐

抖音去水印,抖音去水印快捷指令

和抖音一模一样黄软件叫什么,界面跟抖音一模一样的黄app五

叶夕颜萧君泽抖音,主角叫萧君泽的小说

爱上闺蜜的小叔免费小说,爱上闺蜜的小叔抖音

苹果手机抖音怎么投屏到电视上(苹果手机怎么用抖音投屏到电视上)

抖音上最火的下雨说说让人点赞,抖音上最火的下雨说说

抖音游戏推广怎么赚钱,抖音游戏

抖音视频在线观看入口观看抖音,成版人抖音短视频app下载

抖音在线挖玉：短视频里的宝石探秘之旅，抖音挖矿赚钱app下载

抖音短视频：现代人的快乐源泉，我想看抖音里的搞笑片

探索抖音在线观看的无限世界，抖音在线网址打开

快手下载的视频怎么去掉快手号,快手下载视频怎么去掉快手号水印

快手小游戏破解版游戏大全(快手小游戏破解挂)

快手下载最新版本2023红包版,快手下载最新版本2023

快手下载别人作品对方知道吗,快手下载别人作品会不会有提醒

下载快手app(下载快手app下载)

AI大模型原理(ai模型设计)

相关推荐

抖音去水印,抖音去水印快捷指令

和抖音一模一样黄软件叫什么,界面跟抖音一模一样的黄app五

叶夕颜萧君泽抖音,主角叫萧君泽的小说

爱上闺蜜的小叔 免费小说,爱上闺蜜的小叔抖音

苹果手机抖音怎么投屏到电视上(苹果手机怎么用抖音投屏到电视上)

抖音上最火的下雨说说让人点赞,抖音上最火的下雨说说

抖音游戏推广怎么赚钱,抖音游戏

抖音视频在线观看入口观看抖音,成版人抖音短视频app下载

抖音在线挖玉：短视频里的宝石探秘之旅，抖音挖矿赚钱app下载

抖音短视频：现代人的快乐源泉，我想看抖音里的搞笑片

探索抖音在线观看的无限世界，抖音在线网址打开

快手下载的视频怎么去掉快手号,快手下载视频怎么去掉快手号水印

快手小游戏破解版游戏大全(快手小游戏破解挂)

快手下载最新版本2023红包版,快手下载最新版本2023

快手下载别人作品对方知道吗,快手下载别人作品会不会有提醒

下载快手app(下载快手app下载)

爱上闺蜜的小叔免费小说,爱上闺蜜的小叔抖音