你的当前位置: 首页 > 最新动态 > 公司新闻

打通数据乐鱼体育孤岛激活金矿

发布日期:2024-06-02 09:27:04 点击次数:

  leyu体育●科幻作家、中山大学中文系创意写作教研室主任、广州市作家协会副主席王威廉

  ●广州市人大代表、广州市人大预算委员会委员,工业和信息化部电子第五研究所全国重点实验室副总工程师周斌

  ●广州市人大代表、广州医科大学附属妇女儿童医疗中心妇女保健部主任、广东省妇女儿童工作智库专家邱琇

  ●广州日报全媒体记者申卉、林传凌、赵婉彤、席乐瑶、高鹤涛、王维宣、庄小龙、吴子良、骆昌威、罗知锋、王文宇、陈镜州

  香港科技大学(广州)、广东与先进计算研究院、云从科技、暗物智能、钛动科技、像素数据、致景科技、数说故事、拿火音乐、超讯通信、粤港澳(国际)青年创新工场、热动科技

  “通用大语言模型的智商高于人类是必然的。”“如果人工智能产生意识,是否将重塑生命的定义?”在香港科技大学(广州)人工智能学域,一场科学家、企业家、工程师、投资人、科幻作家、政府部门负责人、记者间的跨界对话,打开了大家对人工智能的想象空间。走进业界,投入巨大的大模型让企业“望洋兴叹”,散落的产业数据成为亟待激活的“金矿”……风口之下的企业众生相,又将我们拉回现实。

  2023年被称为生成式人工智能元年,从ChatGPT到Sora再到GPT-4o,人工智能惊人的迭代速度让各行各业风起云涌。人工智能距离人们的生产、生活有多远?正积极建设国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区的广州,如何抢抓“人工智能+产业”的强劲风口?本期广州日报“发现广州新质生产力”调研团走进高校、研究院和多家企业,与专家学者、人大代表、政府部门负责人、企业家代表等共同探讨如何让人工智能助力各行各业“智改数转(智能化改造、数字化转型)”,将新兴技术转化为新质生产力。

  在这一轮生成式人工智能浪潮中,被提及最多的一个词,是大模型(通用大语言模型)。

  AI1.0时代的判定式人工智能,模仿的是人类的五官,如视觉判断、语音识别。AI2.0时代,基于认知人工智能技术的大模型模仿起人类的思维过程,解决了三大核心问题:一个通用算法可应对过去数十种场景;大量数据得到自动训练,无需人工标注;语音、图像和自然语言能实现多模态融合。基于此,人工智能技术和应用有望迎来爆发。

  曾经靠计算机视觉算法起家的“独角兽”们纷纷闯关大模型,如被称为“AI四小龙”之一的云从科技。调研团在云从科技位于广州南沙的展厅看到,这里展示的除了海关验货、人脸识别、智慧城市等经典场景,还有能与科幻作家PK写小说、能为“打工人”一键生成PPT的AI智能鼠标。

  2023年以来,广州共有10余个行业大模型发布,其中就包括云从科技自主研发的“从容大模型”。在云从科技联合创始人姚志强眼中,“从容大模型”其实只有大模型的基础或技术能力,要真正变成产品,还需在具体业务场景里解决实际问题。

  近两年横空出世的大模型,被包括姚志强在内的许多业内人士称为“大力出奇迹”。这是因为大模型运用强大的算法,并消耗巨量算力,从海量数据中训练出复杂的概率分布函数。而超高的算力和庞大的数据量,成为很多企业训练大模型的“难以承受之重”。云从科技也面临着两难:一方面,全力投入基础大模型要不断投入算力,商业化公司难以为继;另一方面,不跟进又注定落后。姚志强坦言,生成式人工智能将给企业带来远超判定式人工智能的机遇。“我们一方面要努力跟进,另一方面要思考AI的发展方向以及企业在产业链的定位。”

  人工智能“老兵”中,有人选择拥抱变化,也有人选择坚守主业。成立于1998年的像素数据一直深耕视觉识别领域,旗下的明星产品包括理化生实验操作考试的全流程管理系统。这一系统能做到实时识别考生手势和分析考生动作,对实验全程进行AI智能分析判断。“2023年广州中考理化实验操作考试中,像素数据用AI技术分析了24万名考生的视频,结果与人工评分一致率高达97%以上。”像素数据总经理范志鸿介绍,将AI分析技术应用于理化生实验操作考试,这是全国首例。

  像素数据的应用仍聚焦在教育领域。仕博猎头天使创始人邱军涛认为这显得过于细分,他直言:“我把产品分成技术型产品、市场化产品和现象级产品三种。你们的产品在行业有一定地位,可以算作市场化产品,距离现象级产品还有很多路要走。”

  但真的有必要都去“卷”大模型吗?姚志强表示,大模型时代,企业要通过统一的技术底座平台即在一个多模态基础大模型上生成一系列小模型,快速适应海量场景、实现海量应用。如果一家人工智能企业还只有小模型,那意味着企业每解决一个特定场景需求,就要训练一次模型,规模化效应无法显现。

  香港科技大学(广州)协理副校长(知识转移)、人工智能学域主任熊辉认为,通用大模型和垂类小模型应该“两手抓”。一方面,由少数公司去攻克基础大模型,不断推高模型的“天花板”,力争让国产通用底座能力处于国际前列;另一方面,大多数企业的目标应该是力争“做行业细分的冠军”。

  工业和信息化部电子第五研究所全国重点实验室副总工程师周斌深有同感。“当大家都在关注大模型时,不能忽略特定领域的垂直模型。我国工业体系全、品种多,制造业规模全球第一。在单项冠军这个领域,中国可以充当领跑者的角色。”

  从十年前上线“百布”平台为服装企业解决“找布难”的问题,到2022年打造“对布机器人”精准匹配布料,再到今年推出服装AI大模型,致景科技这条“传统产业+人工智能”的路,走得并不容易。

  走进致景科技,纺织工业互联网数智化系统大屏上工厂数、客户数、机台数、订单数等各项数据一览无余。工作人员介绍,该系统链接了全国超70万台织机,有效串起产业链上中下游企业。一台小小的“对布”,将过去十年收集到的布料参数化、信息化,进而搭建起一个布料标准化数据库。在数据基础上,致景科技投身成衣行业大模型,智能设计系统Fashion Mind应运而生。一件连衣裙,可选开袋、半开襟、A字裙、喇叭袖,再选布料颜色……在系统上轻轻一点,三到五分钟就能批量生成十多种同款连衣裙。

  致景科技产研副总裁翟锦修算了笔账,如果每月要在平台上新5万款衣服,即使每天加班也要雇上千名设计师。“这样的成本我们肯定无法承受。”有了智能设计系统,他们只需要10名设计师、10名助理,设计师负责从中挑款,工作效率大大提高。积累多年的数据,成为致景科技最坚固的一道“护城河”。“没有数据积累,人工智能容易变成无源之水。”致景科技资深AI专家张成东直言,如果想做人工智能,最好先从业务做起,把数据累积到能启动的程度,通过SaaS化(软件运营服务)方式向合作伙伴获取信息数据,形成“数据飞轮”,即将业务数据返回到人工智能后端,再不断赋能业务。整个飞轮转起来后,模型也会越来越强大。

  对谈中,广州市人大代表、广州市意筑服饰有限公司设计总监徐香兰抛出一个问题:“我们做的是高端男女装,希望做一些小众风格的服装,可以实现吗?”翟锦修笑言:“从技术层面,未来可以探索升级私域服务和风格模块。”他举例,如果要做背心衬衫,可以上传100件有设计师独特风格的背心衬衫示意图到系统。训练一天后,就能按照设计师风格开款。

  像致景一样,不少科技公司选择“迈入”人工智能风口:数说故事,定位为全球公开商业数据的收集者和分析者,创立近10年来积累了大量消费数据,推出了百亿参数的大模型,进一步通过人工智能分析、生成报告等功能,帮助客户做决策;钛动科技,从商业智能迈向人工智能,也源于其为出海企业做数字化管理时积累下的大量数据;拿火音乐,从音乐圈到科技圈再到人工智能圈不断“破圈”,接下来将推出人工智能色彩浓度更高的新产品,同样是基于早前推出的智能吉他沉淀下的数据。

  大模型赛道火热,但要让人工智能全面赋能庞大的产业体系,依然任重道远。多家企业提到,他们向人工智能赛道发力的过程中,普遍遭遇到算力和数据“不足”的挑战。

  如果说人工智能是驱动各行各业发展的引擎,那么算力就是引擎所烧的油。目前,绝大部分中小企业,受限于公司预算,往往难以接入算力资源;即使能接入算力资源,各类算力提供主体在技术体系、基础架构、调用接口等方面也存在差异。

  除了算力,另一大挑战是数据。随着国内大模型在垂直领域加速落地,各类精细化的产业数据成为亟待激活的“金矿”。

  熊辉表示,垂直领域模型需要有针对性的数据训练,并通过行业专业知识库进行调优。但是,各行业企业数据是私域数据,“困”于各家企业机构内,较难流动和共享。

  广州市人大代表、广州医科大学附属妇女儿童医疗中心妇女保健部主任邱琇在一线也深切体会到“数据孤岛”这一痛点。邱琇在做不同医院数据比对时,最大的困扰是数据无法流动,如第三方机构完成的检测或图像数据难以接入政务系统。

  姚志强直言,如果数据不足,训练出的垂直模型一定会“走偏”,给出错误答案,导致人工智能无法成为真正的生产力工具。“这一点对于企业级应用来说是致命的。”

  传统行业更是如此。广东人工智能与先进计算研究院在为一些企业进行人工智能赋能时发现,传统行业自身信息化尚不完备,企业生产各场景的数据十分割裂。甚至企业自身沉淀的数据,大部分也是非标准的。因此,有的企业委托研究院助其数智化转型的第一步,就是建立高质量数据集。

  周斌尤其关注工业数据采集难的问题。熊辉介绍了其将与广钢合作研发的钢铁行业大模型。“中国钢铁行业全球第一,沉淀了海量的私域数据。行业大模型可以做生产流程控制与各类材料分析,不仅能节约能耗,甚至能预测市场走向。”

  熊辉也坦言,人工智能要想在工业领域落地还相对困难,因为工业领域的数字化水平不足。不过,近期国家推进的大规模设备更新是一大机遇,可以“帮助传统行业进行数字化改造,为人工智能发展打下基础”。

  说到这里,广州市工信局信息技术发展处三级调研员范红永介绍起市工信局正在推进的“四化”平台赋能企业行动,表示可以破解周斌和熊辉提到的数据难题。制造业企业通过“四化”改造,迈向数字化、网络化、智能化和绿色化。“‘四化’改造可以申请补贴,以‘政府补一点、企业出一点、平台让一点’为原则,比如软硬件定制开发项目最高补助为投入总额的30%,金额最高不超过1亿元。”

  “我们这种软件类项目能否申请?”“申请补助的主体是谁?”政策推介引起熊辉极大的兴趣。范红永解释,这次的“四化”改造与此前的技改不一样。“技改是企业更新生产设备,而‘四化’改造对软件有一定比例要求,这对人工智能平台是有好处的。”

  人们对人工智能带有天马行空的想象。调研中,除了对现实问题的探讨,不乏脑洞大开的精彩互动。

  熊辉笑言,人工智能的快速发展让他想到改革开放后出现的个体户。“以前是通过差价卖皮鞋、卖衣服。AI时代,我相信会出现许多AI个体户,像服装设计师、珠宝设计师。在大模型的助力下,一人公司也有可能造出爆款。”

  再往深一层走,熊辉发问:AI能否发展出意识?“大模型的智商可能会全面超过人类。再往下发展,人工智能可能会进入四维空间。到那时,我们对生命或许要重新定义。例如,如果人类加上硅基元素会怎么样?”

  知名科幻作家、中山大学中文系创意写作教研室主任、广州市作家协会副主席王威廉则从现实视角谈起人工智能的局限。“训练人工智能的数据代表人类已知的部分。人工智能所做的一切是否都会在我们认知范畴里打转?”

  他担心,不加思考地接受人工智能,会导致人类的创造力下降。“我感谢人工智能提高了我的效率,但我时刻会提醒自己,不要掉进人工智能的陷阱。”王威廉举例,人工智能写人文社科论文很好,小说写得最差。“因为论文是对已有知识的综合。这也给我们大学老师带来了挑战,如果学生交给我的用人工智能写的论文,比他自己写得都好,怎么办?人工智能时代要如何培养学生?”

  熊辉为他支招:“如果文章是用人工智能生成的,那就要求学生不仅交最终的报告,也要交Prompt(提示词),这样我就能知道你是不是动了脑子。”熊辉认为,在人工智能时代,给大模型下指令也是能力的一部分,“如果你的Prompt很有创意,那我也会给你高分!”