当前位置:天然小说>其他类型>我真的有一座法师塔> 第384章 找对象得看人品(4885)
阅读设置(推荐配合 快捷键[F11] 进入全屏沉浸式阅读)

设置X

第384章 找对象得看人品(4885)(2 / 3)

人说的再好也没有用,我赵文婧,只相信自己的眼睛。

——

尽管是周六,柚子科技办公楼中依旧和平常似乎没什么两样,开放办公区中键盘声噼里啪啦,茶水间永远都有人在聊八卦。

方豫并不鼓励加班,尤其厌恶无效加班,在他看来,强制员工加班和塑造加班文化完全是管理无能的表现。

都已经人工智能了,还加班,不是白智能了?

而且柚子科技的考核模式,也决定了加班并不能对个人产生任何经济效益和级别提升的助力。

但即使如此,柚子科技在非工作日仍旧有不少员工会来公司。

一来,大多数员工都是外地人,周六日在宿舍闲着也是闲着。

二来,所有能够加入柚子科技的员工,都是这个行业中最厉害的一批人,这些人的自驱性本就很强。

当然,最重要的一点,还是这些人亲手参与开创历史的兴奋感和使命感。

只有身在柚子科技,才知道ai时代距离到底有多近!

不,已经不是近,而是科幻片中那个ai掌控一切的场景在技术上已经完全能够达到了!

试问,在这种情况下,哪个做技术的会不想参与其中呢?

错失每一分一秒,可能不久之后,都会是一辈子的遗憾!

相比起半年前柚子科技大猫小猫两三只的局面,目前即使不包含应用组和y搜,柚子科技的大模型组的总人数也超过了两百人。

对于方豫来说,并不是有了柚子和橘子大模型就不需要人类帮助进行算法优化和模型架构的设计了。

事实上,随着柚子科技的发展壮大和高技术人才的加入,这些人在算法和分层架构设计方面有时甚至能给柚子很多启发和方向性的指引。

柚子能够在已有技术的基础之上,推演出最好的搭配并做出优化改进,但并不意味着它能够做所有的开创性研究。

俗话说,三个臭皮匠顶一个诸葛亮,愚者千虑终有一得,这两句话在人工智能领域也同样有作用。

应该说,在已经推开大门的ai领域,缺的就是更多的臭皮匠和愚者。

任何一个领域,在大门刚刚开启的阶段,参与门槛都要比后来低很多,也经常会有技术并没有那么高的人在其领域内做出极具突破性的研究从而名垂青史。

比如发现dna双螺旋的詹姆斯沃森,现在沃森当然是大佬,虽然因为种族言论被冷泉港和诺贝尔取消了荣誉,也是大佬。

但沃森的技术和学术天赋就真的是当时最强吗?

当然不是。

在当时无数顶尖科学家都比他技术水平更强,但发现dna双螺旋的仍旧是他(注1),愚者偶然的一次灵光乍现,可能就是新技术方向和科学理论的一次全新的革命。

现在的人工智能领域也是同样如此。

柚子科技的天才科学家们提出种种架构设想和新的算法方案,柚子在后台进行归纳推演,找出其中最适合的道路,再应用到方豫私密服务器中的橘子大模型完全版中。

有时候柚子也会看似不经意的点破技术团队所面临的一些瓶颈,就这样,柚子科技内部的橘子大模型也在以一种不可思议的速度进化着,这种速度甚至让不少柚子科技的内部员工感觉到恐惧。

时至今日,柚子科技内部的橘子大模型版本号已经迭代到了381,参数也已经正式突破到了三万亿,而方豫私密服务器中的橘子大模型,参数量更是达到了和神之模型接近的八万亿!

八万亿的参数量,已经是目前互联网数据所能训练的极限,即使再增加参数,也没有太大意义了。

其实目前互联网上的有效数据,对于生成式大模型来说,最多只够训练3万亿参数量的大模型,而满血版橘子大模型多出的五万亿参数,主要应用在特定复杂任务上。

比如长期记忆建模、大规模多模态生成、实时交互、深度推理等。

方豫是在周芯国际完成第一批橘核芯片的交货并安装到服务器集群后才启动的八万亿参数私密大模型的训练。

否则且不说数亿大周币的耗电量会不会因此引起有心人的怀疑,也不提方豫根本没有那么多60芯片,就算有,目前柚子科技园机房的电网也无法承受数十兆瓦量级的负载。

而有了橘核芯片,依靠仅相当于60五分之一的电量消耗,就实现了相较60十五倍以上的算力提升!(橘核的标准功耗23未含显存功耗,包括显存功耗情况下是67)

也正是因为柚子科技在产业园内布置了首批一万两千张橘核芯片,柚子才能在二十天之内就完成了满血版八万亿参数橘子大模型的预训练。

目前存在四个不同版本的橘子大模型,性能最强的是方豫私密服务器中的八万亿参数大模型,这个大模型已经完全实现了agi,目前只差分布式小模型的实时数据训练的推动,就能够彻底进化为ai。

其次是柚子科技内部在研发尚未公开发布的38版本,目前这个版本也已经实现了agi,所差的只是在多行业内的应用实训而已。

然后才是公开收费发布的25n版,最后是开源的199de版。

如果不算上方豫私密服务器中的满血八万亿大模型,柚子科技内部的381版本橘子大模型,就是这个世界上最强大模型,并且把第二名远远抛在后面。

前一周,fb公布了他们加急开发的“番茄”大模型,号称达到了4000亿级别的参数量,同时开源了参数量大约为40亿和80亿的两个略小的大模型,可以布置在小型服务器或台式机上。

fb还宣称,他们的4000亿参数的番茄大模型在目前由伯克利和卡内基梅隆大学合作开发的大模型竞技场中得分全面超过juzi25n版本。

当然,这个大模型同样应用的是柚子架构,对这一点fb倒是没做什么隐瞒,毕竟现在行业中除了古狗外,其他所有公司用的都是柚子

上一页 目录 +书签 下一页