第548章 人工智能(2 / 2)

人工智能是何洛计划中的寰宇集团两大重点研究方向之一,到了现在,也已经有了部分的成果,应用在智能客服助手,语音输入和个性化推荐算法等方面。不过,对于现在的进度,河洛依然不算满意。

在何洛前世重生前的两年,微软投资的ChatGPT推出之后,就产生了极为轰动的效应,这款应用发布不到一周就收获超百万的用户,之后更是爆发性增长,成为用户最快破亿的应用。

可以说在ChatGPT之后,掀起来了一阵人工智能的暴风,许多人发现ChatGPT能聊天、代写论文、作诗编程样样不在话下,甚至开始担忧许多职业很快会被其代替。

而ChatGPT同寰宇集团的人工智能目前的研究方向相似,都是预训练模型,或者说是大规模预训练模型。

人工智能研究的三驾马车,是算法,算力和数据。

1941年世界第一台计算机诞生15年后,香农、赫伯特·西蒙等大老参加的”达特茅斯会议”第一次出现了人工智能这个术语,被认为是人工智能的正式诞生。

第一个人工智能的浪潮,科学家们雄心勃勃,希望写出伟大的算法来模拟人类的思想过程。

但是算力的问题导致设计再精妙的算法也算不动。

说白了,就是以当时计算机的硬件,根本无法支持模拟人类思考的庞大运算。

在沉寂十年之后,算力推动了第二波人工智能的浪潮,1982年日本和美利坚都投入巨资研发第五代计算机即“人工智能计算机”,希望一举突破人工智能在算力上的限制。

但是仅仅几年后,科学家们发现即使芯片按照摩尔定律的速度发展仍然满足不了算力的要求,但是没有数据输入到算法,导致第二波人工智能浪潮也沉寂了。

不过计算机硬件和算法一直在发展迭代。

到了新世纪之后,特别是最近的几年,得益于深度学习等算法的突破、计算机算力的不断提升和海量数据的持续积累,人工智能突飞勐进,有希望从实验室走向产业实践。

就像是寰宇集团目前的人工智能发展,前提就是云计算的成功部署,让人工智能研究中心能够获得比较多的算力支持。

另外,就是王晓川集结了国内人工智能方面的许多专家,并且之前的时候,何洛也亲自参与,贡献了他所知道的一些目前能够应用的人工智能深度学习的算法。

可以说,这些算法都是原时空后面研究证明能够走通的。

如果说目前许多有关人工智能的研究是需要在一个迷宫中寻找正确的出口的话,那么何洛则是为寰宇集团人工智能的研究,划出了一条通往出口的最快捷的路线,让他们不会在错误的路线上浪费太多的时间。

在数据方面,通过寰宇集团旗下的众多应用,一直在为人工智能提供数据,进行“投喂”,不断的使其迭代。

同时,人工智能研究中心还雇佣了不少外包公司,对他们所“训练”的人工智能,进行人工标注。

以原时空后来名气极大的ChatGPT为例,这样的语言模型,如果没有人工标注来筛除一些不恰当的内容,那么它不仅会给出一些错误的信息,更会对用户造成心理不适。

更何况,类似ChatGPT这样的预训练模型在训练过程中需使用的数据样本较多,数据标注的需求较高。

那么如何规避上述问题,筛查出有害内容呢?

OpenAI效彷了Facebook等社交媒体公司的做法——构建一个额外的AI模型,向它提供暴力、仇恨等带有攻击性的言论,从而让它学会识别相应内容。

这样的模型会被内置到ChatGPT中,帮助后者过滤掉一些有害的文本。

在这个过程中,需要大量的人力来给攻击性言论做标注。

这种工作,也只能够在初期通过人工来完善审核模型,直到这个模型完善之后,置入到人工智能之中,才能够让人工智能产品达到市场化的需求。

目前这个审核模型已经应用在了寰宇集团各个内容媒体平台的审核之中,大大减轻了人工审核的工作量。

加入书签