新闻资讯
让知识更具价值
首页 新闻资讯 量见·研究院 赵德旭:私域数据是企业最核心资产,而非模型和AI技术
赵德旭:私域数据是企业最核心资产,而非模型和AI技术
2024-06-25

赵德旭,AI,人工智能,私域,AI技术

大家好,今天世界各地正在达成这样一种共识:AI是衡量先进生产力核心指标或者是唯一指标。我今天的分享从三个方面进行:

第一,生成式AI为何是新质生产力的核心?这一轮的生成式AI与之前的AI都有哪些本质区别?

第二,为什么AI模型和AI技术不是企业最核心资产,而是私域数据。

第三,如何根据企业不同现状,实现从低成本Prompt应用到建设企业智能体及垂直模型,构建企业核心竞争力。

接下来我们来看第二部分,数据是智能之母。

1.人工智能的原理

① 人类大脑:树突和轴突

人工智能的原理可追溯至1888年,卡哈尔因其关于树突棘在神经信号传递中重要作用的推测而获得诺贝尔奖。此前,人们普遍认为人类在认识事物时能够立即全面把握,然而,通过对大脑神经的显影分析,发现这一过程实际上是逐层传递的,类似于公路交通中必须按照特定路径逐步前行,如先至南京再至徐州。这一发现为我们理解大脑的认知过程提供了新的视角。


赵德旭,AI,人工智能,私域,AI技术


如上图所示,可以观察到右侧图片展示了树突的存在。每个大脑神经细胞都拥有约1000个不同的连接点,而整个人脑则包含了大约1000亿个这样的神经细胞。这些神经细胞通过庞大的神经网络相互连接和传递信息,通过电信号的激活,形成了人类独特的人工智能。卡尔尔的研究正是基于这一领域,探索计算机模拟是否能够学习并模仿人类大脑的工作方式。

② 人工智能:神经网络

经过一系列的技术演变与发展,我们今天所称谓的神经网络得以形成。以图像识别为例,如下图所示:


赵德旭,AI,人工智能,私域,AI技术


无论是识别人脸还是狗,这一过程并非一蹴而就。相反,它是通过一系列的网络层级,逐步进行边界识别,并在这一过程中捕捉和识别狗的特征,最终作出是否为狗的判断。在针对狗的实体图像进行识别时,五层网络结构足以应对这一相对简单的任务。因此,在探讨Sora为何能够理解和重现人类物理世界的现象时,我们发现其关键在于对每个图片进行的精细切割处理。这一过程与神经网络紧密相连。通过综合判断,Sora根据预设规则将这些图像颗粒进行组合,最终生成视频。这种处理方式使得Sora具备了丰富的物理常识。例如,当纸飞机撞到树上时,Sora能够准确判断纸飞机无法穿透树木,并因此预测纸飞机会掉落下来。


2.生成式AI快速迭代


赵德旭,AI,人工智能,私域,AI技术


2018年GPT 1.0时,其参数规模仅为1.75亿,而到了2019年GPT 2.0时,参数数量激增至15亿。到了3.0版本,参数规模更是飙升至1750亿,这时已展现出相当的智能水平。在GPT 1.0和2.0时期,Open AI并不被外界看好,甚至有人质疑其真实性。然而,到了3.0时期,智能的表现已经初见端倪。进入4.0时代,GPT展现出了与人类相似的智能水平,并首次通过了由人工智能之父图灵提出的图灵测试。图灵测试是衡量机器是否具备真正人工智能的标准,即当人与机器和另一个人通过键盘交互时,如果无法分辨对方是机器还是人,那么就可以认为机器具备了真正的人工智能。

2023年3月,Chat-GPT成功通过了图灵测试,标志着人类迎来了第一个真正的人工智能机器,引起了全球的震动。此外,2023年12月,Open AI董事会已经开发出了Q星模型,预计参数规模将达到125万亿。在此背景下,Sam和黄仁勋等人预测,未来五年内将出现通用人工智能,这种人工智能将有可能完全取代人类。


3.未解之谜:智能涌现

在近期对Chat GPT大型模型训练的过程中,我们意外地发现了一个未解之谜:当神经元数量超过100亿时,出现了智能涌现。这种情况在人类社会中前所未有,它并非简单个体数量的累积,而是产生了质的飞跃。例如,单个蚂蚁或沙丁鱼并不具备显著的智能,但当蚂蚁集结成群,它们能协同完成极其复杂的工程任务,展现出了超常的智能;同样,尽管沙丁鱼个体的智商不高,但当它们汇集成群时,却能够形成强大的群体运动,有效抵御鲸鱼、鲨鱼和各种风暴的威胁。虽然我们在动物界中尚未发现与人类智能相匹配的模型,但在模型训练的特定阶段,我们观察到,当神经元数量达到100亿级别时,该模型开始展现出人工智能的特性,能够理解并输出超越原始输入的信息,这一现象令人震惊,并标志着Chat GPT的一次重大突破。

随着神经参数的不断增加,智能水平也在持续提升。与此同时,全球范围内对GPU的争夺愈发激烈,这是因为随着神经元数量的增加,对GPU的需求也在急剧增长。因此,未来决胜世界的是AI,而决胜AI的又是GPU和硬件。有一篇Jackson于2024年3月3日在《Hacker News》上发表的一篇题为“Revealing Open AI's Plan to Create AGI by 2027”的报道。报道概述了Open AI自2022年8月开始训练的一个参数规模达到125万亿的多模态模型。该模型的第一阶段被称为阿拉基斯(Arakis),亦称作Q星(Q-Star)。根据报道,Q星计划在2023年已完成48%的智商水平。原计划在2024年达到96的智商水平,2025年则预期达到145的智商水平。值得注意的是,智商水平是以爱因斯坦的160为参照,全球平均智商水平约为70-80,而较高的平均水平则为110。因此,当Q星计划的智商水平达到96时,已超越某些地区的平均智商水平。


4.AI技术并不完美

我们看到AI技术为商业领域带来了巨大价值,这一点从英伟达市值突破2万亿美金便可看出。


赵德旭,AI,人工智能,私域,AI技术


然而,当前AI技术仍存在不完善之处。例如,上图中在老奶奶吹生日蜡烛的场景中,尽管她正在吹蜡烛,但蜡烛并未移动。同样地,当水杯倾斜时,AI难以准确捕捉水流动的具体时刻。此外,当果汁开始滴落但尚未滴落时,AI也面临着挑战。这些都显示出AI在刻画物理世界的因果关系方面仍有不足,但随着技术的不断进步和知识的不断积累,AI将迅速取得突破。毕竟,它全天候地在学习全球知识,每一刻都在不断进化。


赵德旭,AI,人工智能,私域,AI技术


众所周知,摩尔定律揭示了一个规律:处理器的性能大约每两年就会翻倍,而价格则会减半。

然而,OpenAI的CEO Sam Altman提出了一个全新的观点,他称之为“新摩尔定律”,即宇宙中的智能每18个月就会翻倍。Sam强调,正是这一快速的发展速度,让我们每个月都能感受到前所未有的信息冲击,对我们产生深远影响。当我们考虑如何训练模型以产生人工智能时,最重要的因素之一是企业的数据和行业经验。这是因为只有借助我们的数据和行业经验,我们才能有效地训练模型,使其产生超越我们自身的智能。

因此,对于任何寻求在人工智能领域取得突破的企业来说,积累和利用自身的数据和行业经验都是至关重要的。


内容来源:量见赋能系列直播,由笔记侠合作整理。分享嘉宾:赵德旭,SAP中国研究院ECO 2.0人工智能专家组组长,2018年度、2019年度中国数字化领军人物。