该系列是由亚利桑那州大学(ASU)和中国官方授权合作伙伴职学CinLearn携手推出的中文公开课系列。每一期公开课将邀请领导与管理硕士、心理学硕士、计算机与科技工程硕士和教育学硕士的授课老师,为学生们带来精彩分享。
大数据是AI时代的基石。据前瞻产业研究院报告数据显示,2020年全球人工智能(AI)市场规模达2万亿美元,预计到2030年将达15.7万亿美元。不难预见,未来几年必定是大数据和AI双向繁荣、双向促进的时代。
本期ASU公开课,特邀Ira A.富尔顿工程学院陈以农教授倾情呈现。陈教授围绕《大数据和AI前沿领域的课程概述》,生动地为我们讲述了关于大数据和AI的方方面面。
△ 陈以农教授 / 图源ASU
陈以农教授(Prof.Yinong Chen)简介:
· Ira A. 富尔顿工程学院教学教授、博士生导师
· 物联网与机器人教育实验室主任
· 中文计算机与科技工程硕士项目教学主任(Faculty Directo)
以下为陈教授的讲述——
人工智能领域简介
1.1前沿计算技术——从一张图,读懂AI发展史
我们的前沿技术,最早从互联网开始,之后我们把互联网变成了计算平台。在服务器与计算层面,我们进一步发展了云计算、大数据。
△ 图源陈以农教授
形成了比较成熟的大数据算法和平台之后,20世纪50年代我们迎来了第一代人工智能,80年代是第二代人工智能,今天的数字人工智能,是第三代人工智能,基于大数据分析而非人脑模拟。在此基础上,我们进入了实体人工智能阶段,即不仅限于数字平台,而是走向实体,走向生活,走向社会。
再进一步的增强智能阶段,我们称之为“互联网+”;另一方面,互联网也在向下发展为物联网。
围绕计算和技术,我们开发各种各样的应用领域,比如电信工业、钟表工业、汽车工业等都在智能化、电子化。这就是今天我们信息技术所涉及的各个领域,美国75%以上的经济增长都源于此。
1.2机器学习与人工智能——ChatGPT的划时代意义
我们刚才讲到的数字人工智能、实体人工智能和增强人工智能,反映出我们今天所说的人工智能和机器人技术领域.
△ 图源陈以农教授
第一层的两个领域虽然不同,但几乎相互覆盖;第二层包括机器学习、专家系统、自然语言处理(NLP)等;到第三层,机器学习包含深度学习、监督学习和无监督学习等。初级的人机对话很早就已出现,但几个月前的ChatGPT,远远超越我们任何一个人的知识和智能,这就是在自然语言的处理之上,增加了机器学习。ChatGPT经过十多年的深度学习、监督学习和无监督学习之后,还将继续发展下去。
我们今天的机器学习是基于大数据,并通过各种平台、设备来收集数据,选择目标数据为我所用。通过将数据进行预处理,把它转换成键值对(key-value pair),之后进行数据挖掘、机器学习、构建模型。
大家注意到,这和我们第一代的人工智能模型完全不一样。第一代、第二代是试图先找到模型,再通过模型进行预测;现在是通过对数据的大量分析反推模型,用机器学习的算法来学习模型。因为我们人脑的模型实在太复杂,再经过几十年,上百年也不一定能真正模拟人脑。
我们最后找到的模型,不一定真正就是我们大脑的思维模型,而是能够反映我们所有收集数据的模型,然后再用这样的模型对我们新录入的数据进行测试,这就是机器学习。
还有就是增强学习。模型是一个不断改进的过程,就像新一代ChatGPT4或5,一边让用户使用,一边通过用户搜集新数据,自我迭代。
1.3从大数据到智能决策——AI可以帮助人,但无法替代人
今天我们从数据收集、数据预处理,来寻找模型、建立模型;通过机器学习,分类和回归;然后我们会建立知识本体,并把知识和模型进行整合以及数据处理。
△ 图源陈以农教授
但并不是所有的人工智都是自主决策,因此我们往往还需要人来做决策,比如医生用人工智能来辅助诊断,显然医生不可能记住或见过所有的病例。如果我们拥有医生使用的药物、病人测试的结果,最终治疗的效果等大数据,就能够调用出来帮助我们训练模型,对新病人的情况给出建议。
整个过程,我们还是需要医生来最终决策。我们不可能把大量数据给医生,需要用一种可视化的方法,让医生能够理解人工智能大数据的决策。这就是从大数据到智能决策的完整过程。
这些成果和计算平台是分不开的。进行实时的大数据处理,需要超级计算机,不是简单的快,而是有针对性地进行软件硬件共同设计,以更匹配人工智能的机器学习。
1.4量子计算与量子机器学习——发展前景广阔
这就要讲到云计算这个虚拟平台,它能够提供从理论上无限的计算能力,还有一个方向是量子计算,他们的计算能力是线性增长,需要处理的数据量是指数级增长。我们要让计算能力匹配数据增长,就需要找出新的计算模式。
△ 图源陈以农教授
其实,上世纪50年代,物理学家Richard Feynman就提出了量子计算机的概念,经过一代代到了超大规模集成电路。虽然主流的电子计算机一直在发展,但是我们一直在寻找新的计算模型,真正有希望取代电子计算机的就是量子计算机。
量子计算涉及到量子比特(位),它具有超级位置和量子纠缠两大属性。
相比数字位(Bits),量子位(Qubits)可以是0和1的超级位置。数字计算,是用确定性的数字去模拟一个不确定的结果;量子计算,算出来的是一个概率,比如推算面前的物体99%是辆车。
量子纠缠的特性更加神奇。如测量了孪生对的第一个量子位,则立即知道第二个量子位的值。量子计算的超级力量来自超级位置和纠缠。
这个非常关键,我刚才提到我们今天数据量的增长就是指数增长,将来要能够真正驾驭数据增长,计算机最终需要实现量子计算。它可以用在需要超计算能力的地方:
实现更快的机器学习。如满足ChatGPT对指数级数据的需求,让机器学习更快完成训练。
打破当前的安全系统。比如网络安全、操作系统安全、软件安全的复杂算法,电子计算机可能需要上百年才能破解。一旦量子计算出现,以前所有为数字计算设计的安全系统就可能被打破。美国已经开始布局要对所有的安全系统进行重新评估和升级。
设计与发现新药物。量子计算能够更快、更好地帮助我们设计出新药物。还有金融、股市、保险等领域,其实都需要超级计算。
前一段时间我参加国际会议,未来量子计算机可以用于优化通讯网络。比如航空领域用量子计算来做通讯系统,可以让超音速飞机,在天空与地面保持实时通讯。通常要保持实时通讯,会有五六秒的时间差,量子计算极大地提升了飞机对障碍物等风险的预判能力。
ASU现在已经在研究用量子位搭建机器学习的模型。希望在若干年后,我们的量子机器学习能够赶超机器学习。
FSE598《前沿计算技术》,会覆盖旗舰课CSE571《人工智能》。因为所有大数据、人工智能都是基于算法,所以需要很强的算法基础,CSE551讲得就是《算法基础》。而《软件验证、确认和测试》,会教你学习软件开发。
由于面向职场人士,我们特地开发了《技术创业》课程。《高级计算机网络》会讲到互联网及各种计算机网络,还有《云计算》、《数据可视化》等课程。其中,《社交媒体挖掘基础》由我们的董事教授刘欢来讲,在ASU只有不到3%的老师获此殊荣。
大数据与人工智能在工业界的应用
大数据和人工智能最早用于银行和证券,也是最为广泛的应用,目前形成了Top10应用领域:
1. 银行和证券
2. 通讯媒体和娱乐
3. 医疗保健机构
4. 教育
5. 制造和自然资源
6. 政府
7. 保险
8. 零售和批发贸易
9. 运输
10. 能源和公共事业
教育行业,如ASU是美国最大的公立大学,线上线下学生共13.5万,会经常用到大数据和人工智能。
U.S.News发布《100 Best Jobs US News2021》排名显示,在前12名中,信息相关的工作收入是医疗工作的1.39倍。大流行病过去后,《100 Best Jobs US News2023》发布的数据显示,软件开发重回Top1,Top5是信息安全分析师,Top8是信息经理,Top9是网页设计,前12名中,信息相关的工作收入增为医疗工作的1.53倍。
△ 图源陈以农教授
Q&A互动答疑
ASU:我本科是计算机相关,硕士课程对于我们的难易度怎么样?
陈以农:我们课程的难度是按照研究生的课程来设计的,相比你是不是计算机专业,会更加注重你是否有数学基础。我们会讲授数据结构算法、程序设计语言等计算机行业方面的主要内容,如果你有数学基础,那么这个课程不会太难。
那么会不会太简单呢?中文课程是按照ASU英文课程设计的,学生需要在本科基础之上才能学习,不会太难,也不会太简单,你一定会学到很多新的东西。我要强调的是ASU非常注重创新,我们的课程不只是理论概念,而是需要学生动手编程实践。
ASU:中文硕士课程和英文硕士课程会不会有很大的差别,大概什么样的差别?
陈以农:我们有2种方式。一种是直接把英文老师的课翻译成中文,大概有4门课是这样;一种是直接请会讲中文的老师,让他用中文把课再讲一遍。在ASU中英文的课程可以相互转换。FSE598算是例外,是我直接用中文讲的,主要针对非计算机的理工科学生。在线英文课程的很多学生也是相似的背景,负责英文招生的老师,邀请我把课程用英文再讲一遍。
感谢陈教授深入浅出的讲解,将计算机理论与实际应用结合起来,抽丝剥茧,层层深入,让我们对大数据和AI前沿领域方面的知识获益匪浅。
关闭