李玉箫介绍
· 清华大学电子系信息与通信工程方向博士在读
· 目前在巴斯克应用数学研究所访学
· 发表过十余篇所在领域顶刊顶会文章
· 国内外多个大厂、研究组织实习经历
02
结合深度学习的数据知识,以及传统推断的模型知识,让我们可以解读复杂信息。举个例子:
问:“我到最近柱子的距离是多少?”那么,传统统计推断的物理模型就可以解读,通过识别波峰,用电磁波的传播速度乘以时间就能知道距离;
如果问:“这幅图的场景有哪些?”图像信号是隐式的,无法建模,无法多步推理,这时通过深度学习可以解出;
我的研究领域侧重无线感知,在对环境感知后,结合各类其他技术,如AI进行后续的处理,实现对物理环境的重建,对环境进行分析,对环境中的人与物进行识别、分析,触发后续的动作等。
谈及深度变分推断框架(Deep Variational Inference Framework),主要分为三类。
第一类是易解概率(Tractable Likelihood)和独立潜在变量( Independent Latent Variables) 。比如说盲图像超分(Blind Image Super-resolution),旨在对未知退化类型的低分辨率图像进行超分增强,由于其对于实际应用的重要促进作用而受到越来越多的关注。主要分为显示建模(Explicit Modelling)和隐式建模(Implicit Modelling)两类方法,目前最新的方法BSRGAN,通过对多种模糊核、下采样、噪声退化进行随机置换,在不同类型真实退化数据上取得了非常好的效果。
04
刚刚我是从无线通信的角度探讨深度学习,能为传统的统计推断框架做什么。接下来我们反其道行之,讨论统计推断可以为深度学习提供什么灵感,联系ChatGPT和大语言模型,来谈一谈。
统计阶段能为深度学习做什么?深度学习本身,比如说大语言模型,它需要加入第一性原理,加入经典的推断算法吗?我认为是需要的。
ChatGPT4脱颖而出主要源于指令微调(Instruction Tuning),在多个以Instruction为指导的大量任务进行学习,让模型在理解这些具体的指令后给出答案。
ChatGPT4的升级之处在于,不用GPT3.5的反馈奖励模型,而采用句式奖励模型GPT4。这也和我的研究联系起来,我会认为把模型知识加进去,比添加新的网络结构去诱导网络更有用、更安全以及更具可解释性。
05
UEM:请问李老师,如何将深度学习应用于不同的领域?
李玉箫:理论领域,目前深度学习应用比较好的是图像和自然语言。再比如带编码的信息信号,机器学习其实很容易在数据集上过拟合,因为自然信号它本身就没有很好的数学模型。但是在传统的,比如脑电信号,还有人体的物理信号,包括我研究的无线信号,UWB、Wi-Fi、蓝牙这种情况下,机器学习现在必须基于传统的方法做一些增益,因为它无法直接使用。
UEM:未来想进入科技大厂,学习哪些领域能帮助我更好地实现职业发展目标?
李玉箫:依据我所了解的情况,如果是博士的话,可能更看重方向一点,但有时候需要看是否契合具体的某一个部门的业务方向。就这几年而言,5G、无线通信、物联网这一块比较火,但这一块科研界也还比较欠缺。智能驾驶这几年挺波动的,企业开的薪酬高,需承担一定风险。
另外的话,图像自然语言这一块,一个是纯的AI赛道,譬如图像、音视频、自然语言处理等任务,薪酬高,竞争也非常激烈。但是如果拿自然语言去做一些别的事情,比如说医疗、风险评估、城市规划,那这些完全可以应对,市场也有很大的需求。
当一个深度学习网络可以识别公园中的一只小狗,我们并不知道这个学习系统到底是聚焦在环境中狗的尾巴上,还是狗所在的草坪。如果机器学习具备举一反三、触类旁通的能力,相信AI的可解释性会大大增强。
感谢李老师的精彩分享,让我们得以窥探AI深度学习的黑盒子!也欢迎你申请马德里欧洲大学的计算机科学与管理硕士,在职学习,斩获前沿的计算机知识。
关闭