2023WAIC观察：当大模型如“雨后春笋” 业界改变了什么？

中新网上海7月8日电题：当大模型如“雨后春笋” 　业界改变了什么？

中新网记者　郑莹莹

在2023年的世界人工智能大会(WAIC)上，大模型“扎堆”。根据大会主办方此前发布的内容，这次大会上有30多个海内外大模型登场，开发团队或是分享大模型路径，或是展示大模型赋能各行各业的多元生态，都争相在大模型发展上有所行动或谋得先机。

(资料图片)

如“雨后春笋”般出现的大模型，究竟改变了什么？

它让“专业门槛”变低

一个初学者如果学画画，可能需要练个几年，才能画出一幅足够专业的画。

人工智能改变了这一情况。它让画画的“专业门槛”变低，仅仅输入一些文字，一幅美轮美奂的作品便在短时间里生成了。

在大会的一场论坛上，商汤科技董事长兼CEO徐立在生成式大模型“商汤秒画SenseMirage3.0”上输入一些提示词：中国龙、蓝色摆件、珠宝风格。

看似简单，但徐立说，该大模型可以根据大众认知，自动“补齐”提示词，让生成的图片细节更丰富。

在“补齐”提示词后，该大模型呈现的是：一张中国龙3D渲染图，具有精细的图案。龙站在一片蓝色“玛瑙海”上，增添了深度和神秘感……

7月6日至8日，2023世界人工智能大会在上海举办。　郑莹莹摄

它让“数据家族”发生改变

因为数据安全问题，很多企业不敢让数据“流通”起来。

大模型下，“数据家族”悄然发生变化。

星环科技创始人、CEO孙元浩认为，运用大模型对数据进行分类分级，可能是个新尝试。

他认为，大模型用的数据可以分为四类：第一类是感知类数据，如视觉数据、语音数据等。第二类是事实类数据，过去很多行业已经能将这类数据结构化，但需要借助大模型将其变化历史找出来，组成完整语义；第三类是知识类数据，过去很多这类数据并没有被有效利用，大模型出现以后有望助力改变这一情况；第四类数据是方法论类数据。

孙元浩说，从感知类、事实类、知识类到方法论类，所有的数据向大模型输入时都需要转化为大模型能理解的语言，因此“大模型时代”，数据产业链需要各种工具以及各种类型的数据库，这样才能真正把大模型用起来。

它让产业变“活”

大模型改变了什么？这对致力于搭“数据乐高”的数库科技创始人兼CEO刘彦来说，并不难回答。

他的团队把SAM(Segment Analysis& Mapping)产业链数据体系升级为UPG(Universal Product Graph)产业链数据体系，“UPG不但有SAM的框架，同时它可以叠加工艺、生产环节、材质、设备等各种类型的关系。”

换句话说，大模型的出现，让该企业搭“数字乐高”的能力更强了。

刘彦说，原来要“提炼”这些关系很难，大语言模型可以跑海量数据、快速生成这些关系，大大提高了效率。

螳螂捕蝉，黄雀在后。当大模型“运动员”越来越多的时候，大模型“考官”出现了。

今年的世界人工智能大会上，作为“镇馆之宝”之一，“蚁鉴AI安全检测平台2.0”(简称：蚁鉴2.0)受到关注。蚂蚁集团大安全事业群技术部总裁李俊奎表示，“生成式大模型是一种‘深黑盒’技术，‘蚁鉴2.0’很像一个24小时不眠不休的‘安全黑客’，致力于找出大模型存在的弱点和安全问题。这种AI对AI的评测，好比‘生成式考官’考核‘生成式运动员’，也是教学相长。”

7月6日至8日，2023世界人工智能大会在上海举办。　汤彦俊摄

它让“智能未来”更具挑战

大模型有了，大模型下的“智能世界2.0”就能来了吗？

还没有。生成式大模型，以概率的方式生成内容，会生成似是而非的内容，这也被称为“幻觉问题”。

如何让语料更精准、让大模型减少“幻觉问题”，业界在努力。

上海数据交易所总经理汤奇峰在大会上称，大模型建设中，语料库是一个非常重要的方面。上海数据交易所致力于建设高质量的语料库，推动人工智能大模型产业的发展。

在今年的世界人工智能大会上，中国电信发布行业大模型Telechat。据中国电信数字智能科技分公司副总经理何忠江介绍，Telechat依托中国电信云网融合优势，利用自研技术增强大模型的预训练和推理能力，减少大模型“幻觉现象”；同时，Telechat大模型正在与千行百业的信息化解决方案进行融合，以满足多样场景需求。(完)