您现在的位置: 首页 资讯 > > 正文
中关村科金张杰:领域大模型给了科技公司在大模型市场上弯道超车的机会
发布时间:2023-07-07 18:03:26 来源:商业观察网

自2014年成立以来,北京中关村(000931)科金技术有限公司(以下简称中关村科金)就选择专注于企业服务赛道提供对话场景服务,聚焦生成式AI技术,包括领域大模型、大数据分析、多模态交互三大核心技术。如今基于这三大类核心技术,已形成了一套完备的技术体系,并构建了一个基础的技术底座——即生成式的得助对话引擎。


(相关资料图)

基于得助对话引擎中关村科金打造了三大产品矩阵,包括数字化洞察与营销、数字化服务与运营、数“智”底座,升级推出全新的云呼叫中心、全媒体智能客服、智能外呼机器人、智能质检、智能陪练、智能音视频等一系列产品和服务,覆盖了用户服务的全生命周期,包括售前、售中、售后等环节,被广泛应用于金融、政务、零售、大健康、制造等行业。

“通过新一代的得助对话引擎,我们正在从传统的对话引擎迈向大模型的对话引擎,用一套对话引擎支持多种业务系统,业务系统会基于行业线进行拆分,在不同的行业线还推出了私有化和SaaS化的版本。”中关村科金技术副总裁张杰介绍,通过一套技术体系对产品进行能力赋能具有很多优势,以前产品矩阵的底层有几百个定制化模型,运维起来非常麻烦,现在可以统一用一套大模型就搞定了。

为何执着于打造领域大模型?

自 2018 年开始,预训练模型逐渐兴起,起初用的比较多的是判别式模型,例如 BERT 模型。近几年,预训练模型几乎是以爆发式的速度增长,参数规模逐年上涨。尤其是去年 11 月底,ChatGPT 火爆出圈成为革命式的事件,基于 GPT 出色的生成效果,很多传统的 NLP 任务都规划到了生成模型中。

其实早在ChatGPT出现之前,中关村科金就已经认识到大模型是个大趋势,决定把公司已有产品的底层核心引擎全部转移到大模型上,这一路线与很多All in AI的公司是一样的,但不一样的是中关村科金聚焦的是领域大模型,而非通用大模型。

目前,虽然AI大模型在文学、医学、数学、计算机科学等领域表现了出前所未有的理解与创造能力,但现阶段大模型面临的挑战是巨大的。

首先,训练大大模型对算法和算力都有着极高的需求。据OpenAI团队发表于2020年的论文《Language Models are Few-Shot Learners》,训练一次1746亿参数的GPT-3模型需要的算力约为3640 PFlop/s-day,成本约为460万美元,以此现状来看,目前市场上的大多数企业是无法承受如此高昂的算力及成本消耗的。

其次,除了算法和算力外,数据对于训练大模型也至关重要。而现在获取与管理数据的成本也在持续增加。还是以GPT为例,OpenAI公司在数据标注上已投入数千万美金,据悉,标注一个强化学习数据成本高达50美元。

第三,大模型所涉及的伦理、道德、安全等问题也在受到越来越多的关注。

张杰认为,从长远来看,通用大模型确实能给行业带来巨大的价值,但从目前来看,通用大模型在处理专业问题方面还不是很聪明,不能满足企业对专业性、合规性、规模化的需求。相反领域大模型不仅不需要依赖特别大的算力和参数,还能切实解决领域内某几类细分场景的问题。比如财富管理领域的大模型只需要50 亿参数规模就能很好地用于营销、客服等场景,那就没必要做成1000亿参数 ,避免用大炮打蚊子,节省算力消耗的资源。

与通用语言模型相比,领域大模型更专注于某个特定领域的知识和技能,具备更高的领域专业性和实用性。

在进行领域模型探索的同时,中关村科金也没有忽略应用层。2022 年,在中关村科金 AI 平台能力中心的主导下,公司的智能外呼、智能客服、智能质检、智能陪练等产品通过自研的对话引擎全面拥抱大模型,充分挖掘企业各类对话场景数据价值,帮助企业实现更加智能的沟通、成本更低的运营维护。

大模型高不可攀,领域模型却能弯道超车

自ChatGPT崛起后,人工智能才真正地走在了聚光灯下。

当前,仅国内号称投入大模型的厂商就多达30多家。按照参数量和应用领域的不同,大模型市场正迅速分化为通用大模型与领域大模型两种路径。虽然通用大模型在许多领域都有着卓越性能表现,但在专业和更加细分的垂直领域,通用大模型所表现出的能力却差强人意。

与“一本正经地胡说八道”的大模型相比,企业客户显然更倾向于针对某一特定领域或任务专门定制的领域大模型。与通用大模型相比,领域大模型对算力和算法的要求没有那么高,而对于数据的要求较为苛刻。

据张杰介绍,To B场景下,训练一个领域模型更要有一些高质量的、小规模的数据,但数据标注成本比较高,不是每家AI公司都有能力自建团队去做,这是中关村科金能做大模型应用的一个门槛和优势。

中关村科金新一代得助对话引擎的核心能力是:领域CoT + 领域大模型 + 领域知识库 + 领域能力套件。通过将领域的know-how转化为领域CoT,使大模型具有更复杂的业务问题解决能力;通过外挂知识库的形式,把事实性知识的流程性知识都放在领域知识中台内,大模型用来做抽取、调度和生成,然后下游业务系统通过API获取结果,以保证业务知识的实时性、可靠性;通过领域能力套件,打通大模型和企业已有系统的融合,建立模型和企业已有业务系统的无缝链接,将大模型的能力充分释放到各个业务系统中。

把某一特定领域高质量的领域常识数据灌到大模型里训练,就可以让模型具备更多的领域知识,学到领域的语言特色,对领域数据的理解能力和生成能力也会提升。得助对话引擎主要特点是以大模型为中心,传统对话引擎相关的意图识别、对话状态跟踪和话术生成等任务全部由大模型进行判别和自主执行。

除了将通用大模型这个“文科生”变成领域专家外,保证整个对话过程的可用、可信、无害和可靠,中关村科金还自主研发了领域prompt工程组件,可以有效将对话能力约束到领域边界内,使大模型可以在业务规范下,安全、可靠地完成对话任务。据张杰介绍,在新一代得助对话引擎的设计中,充分考虑到实际业务情况,轻量化部署本地化大模型是未来企业的强烈需求,中关村科金研发了本地化大模型的快速优化套件,主要包括领域知识的注入能力、领域prompt生成能力、领域指令自主生成能力、领域指令微调能力和领域规范行为对齐能力,可以帮助企业快速构建适合于自身业务场景的大模型,降低大模型在企业的落地门槛。

值得一提的是,通过“学、教、用”三步走路径,得助对话引擎可以帮助企业构建“超级员工”,助力企业提升服务价值。

第一步:学,大模型在领域数据上的无监督学习,这一步的重点是让大模型从散落在各处的数据源中萃取出领域事实性知识,如各种培训材料、行业通用知识等,让大模型能够理解领域知识,成为一个具备领域知识的“普通员工”。

第二步:教,从人类反馈中以小规模有监督学习的方式做微调。“普通员工”依托专业的产品设计,不断和人类专家进行闭环反馈。基于人类专家的反馈,它能够不断地获得提升,逐步成为“超级员工”。

第三步:用,在特定场景下以机器人或助手的方式应用。这一步的关键点是产品设计,如何合理的为人类员工和数字员工分配任务,实现能力互补,并且让数字员工从业绩反馈中持续学习。

张杰坦言,“使用大模型以后,已有的对话产品中定制化建模的成本降低了,而且之前技术达不到要求的对话场景现在也可以做数智化尝试,AI 落地的商业空间更大了。”

在企业的数字化转型进入深水区后,大模型之间的竞争也将进入白热化。想要训练一款性能卓越的通用大模型,无论是技术和资本上的投入都是巨大的,这对于普通的中小企业来说是无异于无底洞。在此情况下,创新型企业可以选择换条赛道,以领域大模型为切入口,与大厂形成错位竞争,根据市场定位和行业发展趋势,提供有差异化和有竞争力的定制化大模型,以此寻求弯道超车的机会,实现业务的更快增长。

领域大模型的未来趋势展望

我们看到,大模型的广泛落地带来了工作方式的革新,大模型正在重塑企业生产关系,重构商业格局。

大模型混战之际,业界也在讨论和预测大模型的终局。张杰的判断是,未来会呈现出基础大模型多家并存、领域模型百花齐放的状态。

“基础大模型,特别是多模态基础大模型,未来应该只有几家公司做,因为做基础大模型需要大量的数据、算力和人才,这些组合资源极少部分企业能够承担得起。因此,未来一定是有数据、有算力、有人才的公司,更可能去构建出基础大模型。基础大模型未来会聚焦在提升多模态能力、挖掘复杂推理能力,以及构建应用生态圈。”

基础大模型如果想用在实际业务中,还有很多方向需要适配,例如在法律、医疗、金融、政务等领域,很多工作流程逻辑复杂,且对数据敏感性、业务可解释性要求高,基础大模型在这些场景无法直接商用。

这就给未来其他企业留下了空间。如何根据实际的业务,将大模型转化成一种具有高效的计算方式的小模型,小模型再根据专业知识做注入、指令微调、思维链提升、对齐等,使其更适配某一领域的规范约束。

对此问题,中关村科金需要思考的是,如何发挥自身优势,在领域内如何积累数据,如何沉淀领域知识,如何将领域知识注入到大模型上,以此构建自己的技术护城河。

“可以畅想,未来大模型领域会是一个百花齐放的局面。个别头部企业会去做大模型,其他企业根据大模型的能力提升每个领域的中小模型,中小模型再结合领域的知识,变得更专业化,这是一个大趋势。”张杰如是展望。

(免责声明:此文内容为广告,相关素材由广告主提供,广告主对本广告内容的真实性负责。本网发布目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责,请自行核实相关内容。广告内容仅供读者参考。)

(责任编辑:王治强 HF013)

标签:

解读《新时代的中国绿色发展》白皮书:坚定不移走绿色低碳发展之路

国务院新闻办公室近日发布了《新时代的中国绿色发展》白皮书。白皮书向国内外讲述新时代推动绿色发展的...

新兴食品现身市场 “植物肉”产品能否“俘获”消费者的胃?

最近一段时间,部分超市和电商平台售卖的植物肉纷纷推出促销优惠活动,销量看涨。不过也有消费者表示,...

绍兴招才引智云对话活动举行 诚邀天下英才“会盟”绍兴

懂人才是大学问,聚人才是大本事,用人才是大智慧。近年来,绍兴市大力实施人才强市战略,持续深化人才...

江苏省自然资源厅出台指导意见 推进老旧小区改造工作

省自然资源厅近日出台《关于大力推进城镇老旧小区改造工作的指导意见》,针对城镇老旧小区改造中规划和...

2021年中国心血管健康指数排名:江苏位列前五

进行了排名,江苏位列前五。北京、上海、江苏等地居民心血管更健康这项发表在《中国疾病预防控制中心周...

科研人员揭示5种豆科植物的核型数据及亲缘关系

近日,四川农业大学林学院副教授罗小梅团队在遗传学领域期刊《基因》(Genes),在线发表了题为《基于5S ...

“烟火气”十足的“江苏味道” 河西CBD顶流商圈开街迎客

开街啦!5月18日上午,在河西CBD金融城融媒路上,2022江苏省新能源汽车&信息消费创新产品推广系列活动启...

首个锌金属的伴侣蛋白诞生 有助于解决缺锌公共卫生问题

据17日发表在《细胞》与《细胞报告》杂志上的两篇论文,美国研究人员发现了第一个锌金属的伴侣蛋白,并...

科学家首次揭示糖尿病卵母细胞起源 有助于减少生育缺陷

5月19日,记者从浙江大学获悉,浙大医学院附属妇产科医院黄荷凤院士团队与中国科学院徐国良院士团队合作...

前4月河北省电信网络诈骗案件发案数连续4个月同比下降

记者从省政府新闻办5月18日举行的河北省打击治理电信网络诈骗犯罪工作新闻发布会上获悉,今年1至4月,全...

重庆:到2025年25个重点领域企业能效全部达到基准水平

3月18日,重庆日报记者从市发展改革委获悉,日前,市发展改革委、市经济信息委、市生态环境局、市市场监...

重磅!2021“发现重庆之美”获奖名单揭晓

3月19日,2021发现重庆之美颁奖典礼在线上举行,最美城市管理人、最美坡坎崖、最美街头绿地、垃圾分类时...

去年重庆回收废弃农膜1.4万吨 农膜回收率达89.31%

3月16日,市五届人大常委会第六十九次主任会议听取了市政府关于《重庆市人大常委会对市人民政府农业面源...

申报分两批!今年国家级博士后科研工作站新设站工作启动

3月19日,重庆日报记者从市人力社保局获悉,为推动产学研深度融合,加强博士后工作平台建设,我市将开展...

浙江鄞州:“水、电、气、数”通办专窗实现城乡公共服务均等化

近日,在宁波市鄞州区邱隘镇公共事务服务中心,66岁的邱隘镇沈家新村居民邱秀月在一个窗口相继办理了不...

打开“浙里办” 浙江1000家农贸市场农产品可线上比价

今天哪个菜场的五花肉最便宜?食品安全抽检结果怎么样?这些问题,浙江居民只需打开浙里办APP上的浙里市场...

浙江鉴湖国家湿地公园规划发布 打造乡村数字旅游

19日上午,鉴湖国家湿地公园规划发布暨东鉴湖农旅观光体验启动仪式在绍兴市越城区陶堰街道举行。当天,...

总投资超10亿元!6个石化装备运维项目在岱山签约

日前,总投资超10亿元的6个石化装备运维项目在岱山经济开发区集中签约。此次签约的项目占地106亩,规划...

如何避免成为“买而不做”的“装备党”祝 杰

自恋是人的天性,人们总是希望自己是更好的,那么自己拥有的事物,也就相应地被自我赋予了更高的价值,...

山西临汾:率先在全省建起农村集体经济开发区

3月17日,临汾市农村集体经济发展(集团)有限公司在临汾经济开发区揭牌。以此为标志,临汾率先在全省建起...

一线工作近22年的缉毒警:我知道坏的是毒品不是人性

  “影子”般的缉毒警:一线工作22年,我知道坏的是毒品不是人性  如果我不继续干,别人也要干,缉...

广东肇庆“毒驾连撞5车致1死”肇事司机被批捕

  1月5日14时30分许,广东肇庆市端州区一男子赵某毒驾连撞5车,致一人死亡。  1月10日,澎湃新闻(ww...

江西最大文物倒卖案宣判:倒卖国家二级文物 9人获刑

  中新网南昌1月10日电 (冷峥嵘 张一怡)江西省共青城市人民法院10日发布消息称,近日,该院依法审结...

青海保障门源地震后生活必需品应急物资

  中新网西宁1月10日电 (记者 孙睿)记者10日从青海省商务厅获悉,青海海北州门源县6 9级地震灾害发...

广西东兴口岸恢复通关 入境需网上预约

  中新社防城港1月10日电 (翟李强)自2022年1月10日零时起,广西东兴口岸和边民互市贸易区恢复人员、...

呼和浩特:寒假期间有条件的学校要开展校内托管服务

“中国最后一个原始部落”翁丁老寨火灾原因公布

北京市十五届人大五次会议胜利闭幕

天津市委市政府致全市父老乡亲的慰问信:我们一定能够打赢

天津米面油存量由20天提高至30天 超市菜市场进货量翻倍

兰州名师话“美育”:“尚乐立人”分层培优 以“美”润教

子夜直击,天津寒天战“疫”

重庆姐弟被生父扔下坠亡案上诉期结束 一审法院暂未收到两被告人上诉状

天津:划定封控区 全市开展全员核酸检测

江歌母亲江秋莲:尊重法院判决,法律认定在我意料之中

中国边疆“北方第一所”:9名民警守护“生命禁区”

辟谣!网传“封控区管控区相继解封”通知并非西安

河南安阳9日12时至24时新增11例本土确诊病例

老人5折环卫工8折生活困难免费 这家面馆背后有个暖心事

铁路公安以110幅优秀书画作品庆祝人民警察节

本周中东部冷空气频繁 东北等地有降雪

河南新增本土确诊病例60例

“打拐”民警眼里的百态人生:见证一份份不愿放弃的爱

迎腊八北京晴天上线 阵风6至7级体感冻人

多省份倡议春节“非必要不离开”,这地补贴1000元

伪造国家机关证件典型案例发布 有力打击制假贩假行为

15年照顾170多个新生儿 金牌月嫂“漂”到海外去看娃

江歌母亲江秋莲诉刘鑫案一审将于今日宣判

河南省安阳市两地划为高风险地区 一地划为中风险地区

员工迟到一次罚一千引争议 单位惩戒员工法律边界何在?

以体育人 秀出“青年范儿”

保安、厨师曾被竞业限制 企业滥用竞业限制让员工很苦恼

反诈老陈破圈:人民群众在哪 就把反诈宣传开展到哪

一所中职学校的育人实践

各地严惩恶意欠薪 保障农民工及时拿到工资

中学生成剧本杀行业潜在消费人群 多方助推行业“净化”

“这就是我最好的选择”

对餐饮浪费说“不”(百姓关注)

校园“直通车” 服务“零距离”

琉璃河遗址 两段铭文共证北京三千年建城史

千元修复个人征信报告?银行:“征信修复”都是骗局

琉璃河遗址 两段铭文共证北京三千年建城史

北京公交将开展无人驾驶道路测试

河南郑州调整五地为中风险区域 公路入郑需核酸检测阴性证明

“共享法庭”让金融消费者畅享“智慧司法”便利

《传奇2》网游著作权纠纷案峰回路转 最高法五份裁决四份改判一份发回重审

三代警察:从未放弃的28年

“胡叔叔”的寻亲工作室

天津津南本轮本土疫情第3—20例阳性感染者活动轨迹公布

“团圆”行动刑侦专家吕游 每一个案例都有单独的技术方案

河南“战疫”直面五重考验

开考古书店日均两三个顾客 流量时代她决心仍是只卖书

冬奥开幕在即 “双减”催热冰雪课堂

“不得以任何借口拒收患者”彰显生命至上

天津多站进京车票暂停发售

x 广告
x 广告

Copyright ©  2015-2032 华西自然网版权所有  备案号:京ICP备2022016840号-35   联系邮箱: 920 891 263@qq.com