沪市,AI研究所大楼。
下午三点多,正是最困倦的时候,几名三十出头的研究员却拿着一沓资料满脸愁容。
“真是奇怪了,这些数据我明明都输入了几遍了,每次我都检查过了,是没错的,怎么每次得出的结果都不一样。”
“到底是哪里出了问题?”
数据资源管理部门的研究员张伟烦躁地抓着头发,怎么也想不明白。
“估计是数据本身出了问题,人工智能的研发不是那么容易的,而且之前我们的信息库被泄露过,到现在都没有完全恢复。”
“外国那些顶级黑客团队,你也是听说过的,我们的信息是不是被篡改过都不一定。”
同部门的梁储劝道,“现在咱们研究所就跟沙漏一样四处透风,以前的成果算是全报废了,现在是一切都要从头开始,没有冯杨教授,以我们的能力也很难做到力挽狂澜,还是等刘策教授从京都回来再说吧。”
“刘策教授说这几天会从京都来一位新总工接替冯杨教授的工作,到时AI研究项目将会重启,希望这位新总工是有真材实料的,不然咱们华国的AI项目,算是彻底没戏了。”
张伟幽幽叹了口气,“但愿如此吧。”
其他几人闻言,也纷纷叹了口气,顿时感觉前途一片灰暗。
几人走到休息区随意坐了下来,低着头,兴致都不是很高的模样,甚至心里还有些烦躁,尤其是看到休息区居然连茶水都没有,更烦了。
就在这时,几人看到一名没有穿防护服的小青年走了过来。
AI研究所的研究所在制服上面要求虽不严格,偶尔也有研究所不穿白大褂,但这小青年穿得这么随意的,还是第一个。
尤其是连个工牌都没有,肯定是最近新来的实习生。
“你是新来的实习生?”梁储直接朝小青年说说道,“你来的正好,会客室的茶水没了,你去接一下。”
实习生一来没经验,二来基础不牢固,不可能一来就接触核心项目,只能做些基础或者打杂的事情。
让实习生做些端茶倒水的活,这是每个公司都会出现的事情,这里也不例外。
陆隐有些意外,但还是没有拒绝,说起来会客室的茶水,也确实是他喝完的。
而且,他猜测,这几人应当是还不知道他的身份,他倒想知道,等他们知道自己身份时,会有什么反应。
想到这,陆隐不仅装了茶水,还去茶水间拿了很多小零食。
几人看到新来的居然这么“懂事”,纷纷露出满意的神情。
陆隐瞄到几人放在桌上的资料,沉吟片刻问道。
“你们是在用AI计算数据吗?我能看看吗?”
几人嗤了一声,有些不屑。
“我说你一个实习生,刚来没几天就想参与核心项目了?你就不怕坏了规矩?”
梁储瞥了陆隐一眼,有些不满实习生的越界,但想着这些材料都是错误的,也没揪着不放,直接将资料丢到陆隐怀里,满脸烦躁。
“拿去吧拿去吧!反正都没用了,你看就看吧,给你长长见识也好。”
陆隐没说什么,拿着资料快速翻阅起来。
看了大概五六分钟,他心里也大概明白问题出在了哪儿。
“你们是不是在为计算不出正确数据烦恼?其实是你们忽略了一下问题。”
几人一愣,挑着眉头看向陆隐。
“你一个实习生,你懂人工智能?”
张伟嗤笑一声,开始对这个新来的有些不满了。
他们都是在研究所待了三年多的老研究员,在来之前,也都是各地的精英,连他们都无法解决的事情,你一个小小实习生看了几分钟就能看出来?
给你涨涨见识就完了,你竟然还当真了?
陆隐没有理会张伟的态度,神情严肃地点了点头,“略懂一些。”
“首先就是这个数据的问题,你们采集的数据并不完整。”
陆隐指着材料中的几处数据直接说道,“这些数据并不平衡,而且没有足够的事例来支持这些特征和类别,这就导致AI在这些方面表现得不准确,这称为数据噪声和偏差。”
“其次就是数据集中的噪声或偏差也会导致AI过度关注这些不准确的样本,可就会导致错误的预测或分类。”
“最后就是独立同分布假设,机器学习需要独立同分布的书,但现实世界的数据往往不满足这一条件,这就导致模型在实际应用中表现不佳。”
“你们这份材料,就很典型的踩了这几个雷。”
几人听后心头一震,诧异地看着陆隐,好半天做不出反应。
他们万万没想到,这个新来的,竟然真的懂!
而且,他说的这些,好像还真是他们一直忽略的。
根据这份材料,接下来的十几分钟,陆隐给几分讲解了AI在计算过程中反复出现错误的原因。
刚才说的只是其中一点,AI在计算过程中反复出现错误的可能性还会涉及计算选择和计算,以及训练方法不当,数据的安全和环境因素。
本小章还未完,请点击下一页继续阅读后面精彩内容!