大模型的中场战事 深入垂直行业腹地
自从OpenAI于2022年11月推出ChatGPT后,一场波及全球科技界的“AI海啸”就此爆发。
自今年以来,国内已有超过30家企业入局大模型赛道。从百度“文心一言”、阿里“通义千问”的发布,到网易“玉言”、科大讯飞“星火”、昆仑万维“天工”等的推出,再到腾讯“混元”、京东“ChatJD”、华为“盘古”等的预告。互联网巨头、科技公司纷纷秀出“肌肉”,谁也不想在这场大模型混战中掉队。
(资料图)
在由OpenAI引发的这场狂奔中,大模型的发展阶段已经从“通用”迈入“垂类”。如果说通用大模型是大模型发展的初期阶段,那么垂直场景应用则可以视为“中场战事”。
在该阶段,应用与场景先行,倒逼垂直领域的大模型飞跃发展。不少医疗、金融、教育等行业内拥有用户数据积累的企业,已开始基于大模型“底座”,训练适配自身的垂类模型,比如近期由上海联通、华山医院联合开发的Uni-talk、医联“MedGPT”、云知声的“山海”等。
大模型路线分化
大模型让人类感受到的智能,是就像人类自身的学习那样,通过通用知识和逻辑能力的训练,具备了解决各种问题的能力。
大模型也有这种能力,基于文本语料采用无监督学习训练的模型可以用少量的监督样本,用于各类机器学习任务,比如图片分类、翻译、对话、写代码等,这样的能力就是所谓的通用能力。
当大模型发展到一定阶段,各领域企业意识到,其通用能力已无法承载更为专业的领域,比如医疗、金融等,每一个领域都是独立的知识体系,具备极为庞杂的知识量,显然仅靠通用大模型无法满足垂直领域的需求,这也为大模型之后发展路径的分化埋下了伏笔。
事实上,通用大模型发展至今,面临算力需求大、训练和推理成本高、数据质量不佳等挑战。一个成功的且可对外商业化输出的通用大模型,要求厂商拥有全栈大模型训练与研发能力、业务场景落地经验、AI安全治理举措、以及生态开放性等核心优势。
另外,训练基础模型的成本也是非常之高,做一个千亿级的大模型,需要单机群万卡以上的算力。从国内外来看,真正做通用模型的公司并没有那么多。相反,训练垂直领域模型所需要的代价和资源远远小于从零开始做通用模型。
因而,从商业逻辑的角度来看,大部分公司不具备做通用大模型的能力,巨头更适合做通用大模型,拥有丰富场景数据积累的公司更适合做垂域模型。
垂类大模型以深度解决行业需求为主,即企业在自己擅长的领域训练适合自己的“产业版GPT”。这类大模型生成的内容更符合特定垂类场景的需求,质量更高。
当前,已经可以看到不少垂类模型应用在金融、医疗、交易等场景中。比如,彭博社根据自身丰富的金融数据资源,基于GPT-3框架再训练,开发出了金融专属大模型BloombergGPT。
由此,大模型赛道目前出现了三类厂商:一类对标GPT的通用大模型,聚焦基础层的厂商;一类是在开源大模型基础之上训练垂类大模型,聚焦垂直行业的企业;另一类则是专注具体应用的纯应用公司。
通用VS垂类
从通用大模型到垂类大模型,是大模型技术发展到一定阶段的必然结果。
垂直大模型的发展主要体现在各个领域的模型性能持续提升,例如语音识别的错误率逐年下降,自然语言处理的语义理解能力不断提升等。通用大模型则在多任务学习、迁移学习等方面取得了显著进展,已经成为自然语言处理领域的重要研究方向。
比如,生物大模型能够提高AI制药效率。国外的研究报告显示,AI可以将新药研发的成功率提高16.7%,AI辅助药物研发每年能节约540亿美元的研发费用,并在研发主要环节节约40%至60%的时间成本。根据英伟达公开资料,使用AI技术可使药物早期发现所需时间缩短至三分之一,成本节省至两百分之一。
在产业角度来看,通用模型就是“百科全书”,能够有问必答,能够适用不同的产业土壤,而垂直模型类似于单领域的专家,虽然专业,但受众注定是少数人。
从演进路径上看,垂类模型是在通用大模型基础上训练而来,如果撇开通用大模型,垂类大模型不复存在。垂类模型强调领域的Know-How,对于特定领域来说,需要针对该领域的任务做指令学习。行业不同,场景不同,指令学习的区别也极大。比如,泛互联网行业更关注营销、推荐的效果,金融更领域更关注风控、可信、以及营销的效果。
两者的最大区别在于,垂类大模型在资源投入、成本投入等方面的要求下降了,但额外要求是行业Known-How,即对这个行业的知识要求提高了。
而从成本方面考量,通过通用大模型微调实现的垂类大模型相较通用大模型是“几何级别的下降”。根据国金证券的测算,在模型微调阶段,由于训练量级较小,仅为万级,相关的算力成本相比之下可忽略不计。
以斯坦福大学于2023年3月发布Alpaca为例,这是一个基于LLaMA-7B基座,应用5.2万指令对模型微调训练而来的对话类语言模型。该模型基于8块A100微调,微调时长3小时,算力成本不超过300元。
由于垂直应用大模型更符合垂类场景的需求、质量比通用大模型更高,也让众多企业看到了其中的机会。
医联近日发布了自主研发的基于Transformer架构的国内首款医疗大语言模型——MedGPT,其主要致力在真实医疗场景中发挥实际诊疗价值,可实现从疾病预防、诊断、治疗、康复的全流程智能化诊疗能力。
5月,微盟正式发布基于大模型的AI应用型产品WAI,该产品已正式上线包括话术生产、短信模板、商品描述、种草笔记、直播口播稿、公众号推文、短视频带货文案等25个实际应用场景。
作为聚焦物联网与医疗两大领域的人工智能企业,云知声正式发布山海大模型。该大模型针对知识密度高的领域,通过数据训练、训练数据、微调等方式,做一些专业的加强,这样模型既具备了通用应用水平,也针对特殊场景与领域进行了能力的加强。
山海大模型不仅在中文环境下的表现要好于GPT-4,甚至在医疗等个别场景下的表现效果,也已经开始优于GPT-4。目标是在今年内达到ChatGPT的通用能力水平,并在医疗、物联、教育等多个垂直领域的能力上全面超越GPT-4。
云知声创始人、CEO黄伟指出,在AI 1.0时代,虽然基于深度学习,每家都有强大的技术,但整体上并没有本质改变AI用于分类的任务,分类种类的增加仍然处在量变阶段,限制了AI创造价值的上限。
而在大模型引领的AI 2.0时代,为人工智能带来了新的能力,可以打造更多新的产品,满足客户更多的需求,例如医疗、营销、沟通等,能够创造更多的商业机会。
AI对于复杂逻辑理解能力大幅增强,扭转了用户对于AI“人工智障”的刻板印象,也让更多人接受人工智能,为大模型的广泛应用创造的条件。
“大模型所谓的‘思维链’能力,可以告诉用户推导的过程,从而知道中间过程里有哪些东西是错的,优化的时候就可以获得提示了,而不是像过去一样只能看见和调整参数的权重。”
云知声创始人兼CTO梁家恩表示,但就目前而言,大模型仍然是有限的东西,但对于没有见过的东西,大模型会生成“似是而非”的回答,而随着AI生成能力的不断增强,但校验会更加困难,这也让AI行业需要不断去探索新的解决方法。
相信随着越来越多企业入局,垂直大模型在各个行业和细分领域中将大量涌现。而那些能将一个垂直领域做专、做透,用高质量的数据持续优化模型,跑通商业闭环,构建起产业生态的企业,最终将把价值链做到足够长。
抢先读
- 2023呼和浩特赛罕区第八幼儿园现场材料审核通知
- 天天热头条丨2023工业互联网大会专家谈 张倩:守好工业互联网安全“主阵地”
- 全球动态:郑州中国移动2023暑期实习招聘信息
- 全球观察:cad怎么导出pdf格式黑白(cad怎么导出pdf格式)
- 世界微头条丨为汽车消费充“电” 为乡村振兴添“绿”!2023年新能源汽车下乡活动启动
- 环球播报:炸沙丁鱼干粉好还是湿粉好?
- 民间借贷多久结案起诉
- 速读:我国经济运行保持恢复态势 重点在六方面发力
- oppoa57t高清语音怎么开通(oppoa57t) 重点聚焦
- 电脑系统分盘怎么分?电脑系统分盘怎么合并 要闻速递
- 望穿秋水是什么动物_望穿秋水描述什么动物
- 环球滚动:厦门方特端午节晚上有营业吗?
- 蒙城三义镇:织密秸秆禁烧安全网
- 【环球时快讯】湾里管理局中考考点设置及周边交通提示2023
- 从u盘拷贝的3dmax怎么安装(3dmax怎么安装)
- 江阴学费补贴怎么领?
- * 创业板指涨幅扩大至1% 世界速看料
- 观察:美国“俄亥俄”级核潜艇驶入韩国港口
- 速讯:我国首艘海陆一体化生产运营的智能“海上油气加工厂”在南通交付
- 2023年浙江金华中考作文题目点评解析(四)
- 38只个股5日量比超过5倍
- 焦点快播:DEHN参与主编的耐高压绝缘引下线(HVI)产品标准 GB/Z 33588.8—2022 发布实施
- 全球微头条丨全民健身,振兴突破!辽宁省第十四届运动会今晚盛大启幕
- 世界热头条丨板块轮动是什么意思?股票板块轮动快的原因是什么?
- 时讯:青藏线失联近一个月的货车司机遇难,遗体在附近河道被发现
- 每日资讯:KK一夏 端午粽香特惠
- 能链智电于翔:储能技术推动新能源充电服务升级转型
- 天津开设AP的学校有哪些?-天天热闻
- 智能园区智能制造,台达“智慧永续产业园区”COMPUTEX 2023盛大登场
- 环球动态:液冷概念股震荡走高,飞龙股份拉升封板
- 美国疾控中心:枪支暴力推波助澜 青少年谋杀率飙升 天天观焦点
- 全球聚焦:省市联合 共同练兵
- 全球快看:肃宁县人民检察院开展防范非法集资和传销宣传活动
- 北京拟制定养老服务单用途预付卡管理实施细则 天天热闻
- 天天热点!什么食物里有欧米伽三?
- 山有舍民宿酒店管理公司董事长王湘南:选择“小而美”,用艺术的手法改造乡村废弃老宅
- 今日热搜:专访乌兹别克斯坦第一副议长:中国的人权理念更值得借鉴
- 世界快消息!简单百宝箱下载不了是怎么回事?简单百宝箱哪个版本还能用?
- 天天报道:方华富:黄金多头反攻,周五看涨1972/1985!
- 2018年淄博市大学有哪些在全国排名排名名上什么
- 天天看热讯:风暴中央的肿瘤电场治疗:没做错,有反思,盼前景
- 大众汽车调整战略 重点转向高销量车型|天天新视野
- 哪些情况需要拔除智齿-焦点精选
- “泥石流”中的一股清流?国产武侠游戏将何去何从|即时
- 【全球独家】口袋妖怪燃之智雪拉比捕捉位置一览
- 湘潭将实施人工增雨 助力大气污染防治-全球快播报
- 青龙管业(002457)6月16日主力资金净卖出339.35万元
- 电动自行车如何增便利除隐患,交警划重点了!
- 蓝色协议坐骑怎么获得?蓝色协议坐骑获取攻略
- 中雨!大雨!暴雨在路上!陕西发布最新预警,今晚……|快消息
- 翔安今秋将新开办12所学校
- 看热讯:冰箱密封条可以拆洗吗?冰箱密封条发霉怎么清洗?
- 极狐森林版上市,北汽新能源场景化造车再添筹码 世界观焦点
- 格力电器:将继续保持对海外品牌建设的长期投入 全球微动态
- 拆迁补偿标准一般是什么|今日聚焦
- 最美大众成绝唱!CC将停产_环球微速讯
- 淮盐文化研究会(关于淮盐文化研究会介绍)
- 阿里国际站:今年5月义乌自营出口订单量同比增长38.2%
- 天天资讯:汉字找茬王找出12个包包通关攻略分享
- 黄剑足球艺术作品助力国际邀请赛
- 焦点滚动:新皮肤情报 | 静夜挟芳,邀月对弈
- 当前讯息:权威钠离子电池测评结果揭晓在即 近二十家企业送样
- 今日快讯:广西2023年高考志愿填报指南
- 大病医疗二次报销怎么办理?大病医疗二次报销需要提交什么材料?|热资讯
- 2023张家港常阴沙文化旅游发展有限公司招聘工作人员简章
- 文档的编辑排版步骤|环球微动态
- 挂牌和上市有哪些区别?企业在港三板挂牌意味着什么?
- 江西德兴:"检察蓝"护"青山绿" 助力"无废城市"建设行稳致远_微速讯
- 环球报道:一加Ace 2 Pro曝光 配备二代骁龙8与5000万像素主摄
- 大专读什么专业好?2023年男孩读什么专业好就业?
- 茂名个人社保最低一个月缴费多少钱 茂名市个人社保缴费标准2023
- 全球热文:天天速递!场内ETF资金动态:游戏行业规模持续增长,游戏ETF变现良好
- 焦点访谈:武汉泌尿疾病去那家医院「新知识解读」武汉男科医院哪家经济实惠 世界微动态
- 宁波异地就医备案情形一览 精彩看点
- 2023年广西高考志愿填报系统官网入口 全球新要闻
- 成都漫花庄园父亲节免门票优惠活动详情2023|世界独家
- 世界快播:劳动合同工资拖欠怎么办
- 校社联动,蜀汉外国语实验小学学子向毒品说“不”!-当前热议
- 最红95花,因为耍大牌塌房了-当前速看
- 少吃1/4,人的情绪和睡眠更好,爱爱更有感觉|环球观天下
- 餐饮公司无证经营致26人中毒_全球新资讯
- 当前关注:部分机场飞机靠桥率不高影响出行 中国民航局:专项整治
- 视点!怀孕8个月女子遭连开4枪,母子皆亡,被害时正与丈夫在车里等红灯
- 6月16日山东金诚石化集团油品报价暂稳 世界快消息
- 对话愿景娱乐关明贺:直播电商的核心竞争力不是人货场,是这三条|环球速看
- 黑水是哪个省哪个市?黑水县海拔多少米高?_今日讯
- “我希望打卡宁波所有献血屋!”她15年无偿献血7200毫升-速递
- 甘肃125名唇腭裂患儿将接受免费手术治疗 今日精选
- 日本政府拟制定新法禁止应用商店垄断
- 知识产权代理行业前景投资分析|世界新动态
- 神印王座制作方出新动画,已定档,更换平台播出,却引发两大担忧 每日热点
- 每日快播:空调漏水怎么处理视频(空调漏水怎么处理)
- 快报:生物谷回复年报问询函,内容涉及多个问题回复
- 三祥新材:氧氯化锆项目总规划年产能10万吨 二期年产能规划8万吨
- 平顶山将打造全球最大尼龙新材料产业基地!目标产值5000亿!
- 【全球新视野】我国经济运行保持恢复态势 重点在六方面发力
- 5位“新星”即将登陆CBA,三大核心降临背后,辽粤迎来接班人 微资讯
- 强强联手!高举服务大旗,UU跑腿接入滴滴快送
- 水浒英雄手游攻略(水浒英雄游戏) 全球最新
- 印度想让中国手机厂商加快印度化:最终成为印资企业