年初打得如火如荼的「百模大战」,终于有了阶段性的战果。
8月31日,10余家大模型陆续通过《生成式人工智能服务管理暂行办法》备案,最终获批向公众开放。360智脑也已首批完成备案提交,预计将在未来1周左右陆续由各地方管理部门对外披露。
而与之同时展开的,就是各个大厂的疯狂扩招。
现在,全球都在疯抢AI人才。领英数据显示,全球AI技术岗的招聘需求,已经比半年前激增21倍!
几个月来,Indeed上与生成式AI相关的职位大幅上升在美国,顶尖人才可以拿到的薪水,已经接近七位数。
权威评测,4项能力超越GPT-4不过,这只是大模型产品迈向成功的「万里长征第一步」。
产品好不好用,能否有效满足客户需求,能够为社会创造多大价值,更关键的还是要看各个大模型的性能,以及各个公司的产品工程能力。
为了确保大学科目的全面性,C-EVAL从教育部列出的13个官方本科专业中,选取了25个代表性科目,其中每个专业类别至少包含一个。
作为驱动360智脑的大模型360GPT-S2,在C-EVAL中排名第五,平均分超过了GPT-4。
具体来看,360GPT在社会科学类问题上的表现十分突出,凭借着82分的好成绩位列第三。
社会科学相比之下,GPT-4只拿到了77.6分,和国产模型有一定差距。
360GPT能够表现如此出色的原因在于,它在预训练时采用了高质量、多样性的语料。
如果想训练出强大的大语言模型,就需要依托充足的高质量数据。数据的数量、质量、多样性乃至清洗能力,都是影响大模型性能的关键要素。
而360搜索的优势恰恰在此。经过11年多的积累,360搜索已经积累了上万亿网页,以及完善的数据过滤和清洗手段。
在语料处理方面,360采用了低质站点过滤、噪音清洗、多维度去重、基于统计的ngram语言模型过滤、基于标注结果训练的fastText模型过滤等常规数据处理手段。
不仅如此,360还将语料处理结合到了大模型的训练过程中,基于多个benchmark和自有的下游评估数据上few-shot的结果,不断指导预训练数据的清洗。
这样,模型就能更深刻地融入知识,推理解题学习过程大大增强。
最终的结果,就是360GPT-S2在下游任务上的惊艳表现。
360智脑4.0,最新体验效果拔群据了解,360的自研认知型通用大模型——360智脑,目前已升级至4.0版本。
打开如今的360智脑页面,可以看到它比起5月份时的界面,已经焕然一新。
对话角色除了360智脑之外,还有了马斯克、诸葛亮、孙悟空、林黛玉等数字人。
并且,你还可以创建自己的数字人。
其中,最有那味儿的还得是马老板,上来第一句话就是「你在浪费我的时间」!
对于自己要去火星的计划,他解释道,自己的目的是让人类成为多行星物种。
但被问到何时和小扎角斗时,他却忽然谦虚地打起了哈哈。
或者,尝试问一问爱因斯坦,人工智能会不会超过人类智能?
他表示,并不排除人类开发出具有自我意识AI的可能,但在可预见的未来似乎不太可能发生。
找刘备问了个比较刁钻的问题,想不到他的回答还真的和他的人设非常契合。
既不得罪一方,还让你挑不出毛病,看来360智脑是真的懂刘备的!
再比如,我们还可以向王阳明提问:思想家是否也有自我怀疑的时刻?
除了琳琅满目的数字人,360智脑在给打工人提供帮助的各项功能上,也更丝滑了。
比如扮演PPT高手,做出特定主题的PPT提纲。
比如用列表的方式,总计10个关于量子力学知识的重点。
还能解释代码,说明它的功能、算法和执行逻辑。
比如,输入一段快速排序的C语言代码实现。
对于这道题,360智脑不仅给出了详尽的解释,而且还自己「发散」出了一些更加深入的问题,可以帮助我们更好地理解并学习相关的知识。
其实,360大模型作为国内首个能联网的大模型,在今年5月底交卷时就带给我们不小的惊喜。
作为360自研认知型通用大模型,360智脑背后依托的,正是360多年积累的大算力、大数据、工程化,而这些,全是360的关键优势。
360智脑集成了360GPT大模型、360CV大模型、360多模态大模型技术能力,具备生成与创作、代码能力、逻辑与推理、多模态等十大核心能力,还有数百项细分功能。
今年6月,360智脑成为全国首个通过工信部信通院认证的「可信AIGC大模型」。360智脑在10部分36项基础能力评估中全部通过。
报告中,360智脑「展现了大模型强大的实时搜索与回复能力」,多个题目的回答被报告援引为最佳案例。特别是在回答时效性问题上,360智脑表现优异。
汇集顶尖人才,研发半年投入15.6亿从各项实测的结果中不难看出,360GPT在理解力和推理力着实表现不俗。
而不断蝶变创新背后,是360深厚的技术实力。
-数据语料众所周知,大模型若想成功,离不开大量的语料数据。用什么样的数据训练模型,直接决定了模型的知识能力。
凭借自身的搜索引擎,360每天可以从互联网抓取大量的数据。经过处理之后,这些稀有、优质和安全的训练语料,也为大模型的研发带来了极大的优势。
-工程能力凭借为全球200多个国家15亿用户提供持续服务的技术和工程方面积累,360具备了世界级互联网产品的工程研发能力。
-应用场景在流量入口上,360也拥有全行业领先的场景优势。
中国第一大浏览器360浏览器,中国第一大PC安全产品360安全卫士和全国第二大的搜索引擎360搜索,这些流量积累让360未来的AI产品能「站在巨人的肩膀上」完成启动。
与此同时,这些产品的人工智能化也会进一步提升用户的使用体验,迭代出更好的产品。
而360比肩微软的全端应用,搜索引擎,移动办公,游戏等业务提供了丰富的AI场景支撑和用户实时反馈渠道,能为将来大模型的商业化实践和优化打下了坚实的基础。
-大模型安全除此之外,360在AI算法、框架、应用、等涉及到AI安全领域的研究上,也处于全国领先的位置。
这些成绩的背后,离不开360长期以来的科研投入和人才储备。
一方面,360在数字安全、人工智能等领域始终保持高研发投入占比,仅2023年上半年,公司研发投入15.6亿元。
另一方面,360汇集了国内AI行业的顶尖人才。其中,360智脑的算法团队由360人工智能研究院和360搜索团队共同组成,分为预训练、微调、对齐、Code、数据、模型应用共6个小组。
早在2015年,360就成立了人工智能研究院。
经过接近10年的发展,360人工智能研究院具备了国内领先的技术研发和创新能力。
除了在大模型核心算法体系中有着多年的积累外,360还在自然语言理解,机器视觉与运动,多模态大语言模型等领域都处于行业领先的地位。
同时,还提出了多模态预训练框架R2D2,采用pre-Ranking+Ranking策略来学习视觉语言表示,以及two-way蒸馏方法来进一步增强学习能力,大幅刷新了当时的SOTA结果。
周鸿祎介绍,360通过「两翼齐飞」的人工智能发展战略,已经在核心技术、场景布局和产品打磨上取得了丰硕的成果。
借助多年在多方位业务场景中的优势,360版GPT能够像「发电厂」一样,把大数据加工成「电」,进而源源不断地赋能千百行业。