大模型“瘦身”进手机 下一个iPhone时刻将至?
一股“端侧大模型”浪潮正在涌来。华为、高通等芯片巨头正探索将AI大模型植入端侧,让手机实现新一代物种进化。
(资料图片)
相比ChatGPT、Midjourney等AI应用依赖云端服务器提供服务,端侧大模型主打在本地实现智能化。它的优势在于能够更好地保护隐私,同时让手机能通过学习成为用户的私人智能助手,还不必担心云端服务器宕机等问题。
不过,现有技术条件下,手机性能远不足以支撑大模型运行。业内主流的技术方案是,通过剪枝、量化、蒸馏来给大模型“瘦身”,在尽可能少地减损精度的前提下,降低它所需的资源和能耗。
高通已经开始研发用于端侧大模型的芯片。这预示着,部署AI模型的手机终端正在向我们走来。
手机厂商将大模型引向移动端
AI大模型正在从云端向智能终端狂奔。
8月4日,在2023年华为开发者大会上,华为对外发布HarmonyOS 4,相比前几代操作系统,它最显著的一大变化是,将AI大模型能力内置在了系统底层。华为正在拉开AI模型走向“智能终端侧”的序幕。
目前,人们使用ChatGPT、Midjourney等AI应用提供的服务,基本都是通过云端服务器来完成。以ChatGPT为例,它背后的大模型和计算资源都存储在远程服务器上,用户通过与服务器实时交互,被输入的文本经服务器处理后,获得返回响应。这样的好处在于,可以确保模型的高效稳定运行,因为服务器通常配置了强大的计算资源,而且可以随时扩展以适应高负载。
如今,新的支持逻辑出现了。华为正在尝试将大模型引入终端,这意味着上述所有工作都能在本地完成,手机系统本身就具备了一定的AI能力,不需要接入AI云端服务,也能实现智能化升级。
华为常务董事、终端BG CEO余承东介绍,HarmonyOS 4由华为盘古大模型提供底层支持,希望给用户带来智慧终端交互、高阶生产力效率、个性化服务的全新AI体验变革。
HarmonyOS 4引入了AI大模型
HarmonyOS 4的AI能力目前主要由华为智慧助手“小艺”体现。大模型接入后,小艺在语音交互的基础上,扩展了文字、图片和文档等多种形式的输入,自然语言理解能力得到提升。小艺还能根据指令,连接多种服务和场景,比如自动提取图片文字,生成各类商业电子邮件内容或生成图像等。
更重要的改变是,小艺具备了记忆和学习能力,随着不断使用,它将变得越来越懂“主人”,能够智能给出出行、活动计划等方案,并根据根据用户习惯,实现个性化推荐。华为透露,小艺这些新的能力,将在8月下旬开启公开测试体验。
将AI大模型内置于手机系统底层,华为希望借此全盘提升手机的智能化程度。虽然小艺的上述功能并不“高深”,但要实现起来,用户往往需要同时调用ChatGPT、Midjourney等众多应用才能完成。当手机本身有了AI能力后,它就像一个更全能的助手,提供全面的服务。
在HarmonyOS 4发布之前,华为其实已经尝试过将AI大模型接入移动终端。今年3月,华为发布P60手机,其中自带的智慧搜图功能就是基于多模态大模型技术,通过在手机侧对模型做小型化处理,实现了手机端的自然语言模型运行。
将AI模型引入端侧,华为并不是头一家。在2023世界人工智能大会上,高通展示了大模型进入端侧的操作实践,将生成式AI模型Stable Diffusion放在搭载了第二代骁龙8的手机上运行,15秒内执行了20步推理,并生成了一张512x512像素的图像,且图像效果与云端处理水平相差并不明显。
在上海MWC 2023期间,荣耀CEO赵明也表示,荣耀将在智能手机端推动部署端侧大模型,以此实现多模态自然交互、精准意图识别、复杂任务的闭环服务等体验。
备受瞩目的还有苹果,一个月前,苹果被曝出正在秘密研发“Apple GPT”,它是一款基于苹果自研的Ajax框架开发的人工智能工具。尽管具体的细节尚有待披露,但业内普遍猜测,苹果很可能在系统层加入大模型,提升提升语音助手Siri的智力,让Siri摘掉“人工智障”的帽子。
炒作还是新革命?
手机厂商盯上大模型不稀奇,但为啥他们要走“端侧”路线?毕竟,华为小艺的交互、生成能力通过云端服务器也能提供,而且看起来成本更经济、技术实现更容易。
把AI大模型装进智能移动端,是炒作还是确实有其必要性?在这一问题上,无论是余承东还是赵明,都提到了两个关键词:隐私安全和个性化。
余承东强调,华为主张所有AI体验创新和场景设计的第一原则是安全与隐私保护,打造更负责任的AI,并承诺AI生成的内容都会进行标识。
相比在云端处理数据,智能终端侧最明显的优势在于隐私安全。此前,ChatGPT屡次陷入数据泄露风波。今年3月,三星在内部发布了ChatGPT使用禁令,起因是半导体员工疑似因使用ChatGPT泄露了公司机密;上个月,ChatGPT背后公司OpenAI及其股东微软被16人匿名起诉,控诉他们在未经允许的情况下使用并泄露了个人隐私数据,索赔金额高达30亿美元。
当数据处理都在端侧,用户的个人数据将不会上传至云端服务器,大幅降低了隐私泄露风险。这也为手机AI助手真正变成生活管家提供了先决条件——只有隐私得到保障,用户才会放心将数据交给AI去学习。
在赵明的理解中,端侧AI大模型的使命就是更好地理解用户,“知道我几点睡觉,知道我喜欢吃什么,能解决我的即时需求,相当于拥有洞察我需求的能力。”而要做到这些,就需要AI基于用户的个人数据和习惯进行训练,最终智能手机将有希望成为全能助手,或者说是私人机器人秘书,能够帮助用户解决餐饮、订票、咨询、娱乐、办公等多场景的需求。
相比之下,无论是ChatGPT还是其他主流的AI应用,都是标准化产品,在不加改造的情况下很难具备私人助手的能力,它并不了解用户,只是根据用户的输入指令做出相应的回应。个人手机已经是一个私有的个人智能设备,如果理解人类语言的AI模型能跑在手机上,智能化程度无疑将得到大提升。
另外,依赖云端的应用也存在不稳定性,比如由于网络或服务器原因,云端的响应速度可能会变慢,甚至干脆宕机,这在ChatGPT上已经出现多次,本地化的大模型将大大削弱对云端的依赖,从而避免“云卡顿”。
基于上述特点,大模型的“端侧革命”展现出了潜力,甚至有希望让进入发展瓶颈多年的手机再来一次激动人心的物种进化,就像当年大屏智能手机的出现以及iPhone发布时刻一样。
但大模型想在手机端发挥实力存在一个显而易见的问题:手机芯片顶得住吗?由于大模型动辄包含上百亿、千亿的参数,且需要天文级的训练,消耗庞大的算力,现有手机芯片的性能显然无法满足要求。
对此,业内目前较主流的解决方案是“模型小型化”。
简单来说,当模型网络结构确定后,在尽可能少地降低精度的前提下,给模型“瘦身”,从而降低它所需的资源和能耗。这一过程通常有三步,将模型中对精度影响非常小的参数裁剪掉,被称为“剪枝”;使用更低精度的数据类型进行推理,行话叫“量化”;而从复杂的模型中,提取出效果相近但更加简单的模型,被形象地称作“蒸馏”。最终目的,都是为了减小模型体积。
另一方面,高通等芯片厂商,也在针对AI大模型端侧部署研发专用的芯片。此前,高通5G移动平台骁龙8 Gen2首度集成的AI专用Hexagon处理器,采用了独立的专用供电系统,支持微切片推理、INT4精度和Transformer网络加速等,能在提供更高性能的同时,降低能耗和内存占用。
端侧大模型正在掀起新一代智能终端革命。IDC预测,到2026年,中国市场中近50%的终端设备的处理器将带有AI引擎技术。AI带给人类科技生活的又一个巨变或将出现。
标签:
抢先读
- 国家发展改革委认定新一批国家企业技术中心 博泰车联网等8家上海企业上榜
- 周鸿祎:安全企业不能只想卖货,未来靠服务业“说话”
- 【环球新视野】新蔡县棠村镇召开耕地和永久基本农田划定成果核实处置工作会
- 新蔡县法院:细算“经济账” 化解“气官司” 世界动态
- 大模型“瘦身”进手机 下一个iPhone时刻将至?
- 房屋安全如何保障?住建部:拟建 “房屋养老金”
- 新蔡县人民法院“护民生、优环境”2023年第十三次集中执行活动持续发力_每日视讯
- 推进全环境立德树人 加强未成年人思想道德建设
- 平舆县杨埠镇:致富西瓜产业 铺好“乡村振兴路”|焦点要闻
- 天天热点评!农行信阳胜利路直属支行:银行服务无小事 零币兑换暖人心
- 新蔡县陈店镇:预防电信诈骗工作宣讲 时刻绷紧防范之弦
- 新蔡县砖店镇积极开展“反诈我先行”主题宣传活动培训会
- 驻马店开发区开源办事处开展提升公众安全感宣传活动
- 河南省生态环境厅专家组到遂平县调研“美丽河湖”创建工作 全球快资讯
- 【环球速看料】新蔡县砖店镇开展食品安全大检查
- 环球热讯:罗山县庙仙乡:贴心服务,帮助困难学子圆梦大学
- 世界滚动:河南新县:夏日黄毛尖 云海美如画
- 江苏:除南京、苏州市区外拟全面取消落户限制政策
- 黑龙江省台办募集30万元生活物资送洪涝灾区
- 今夜调油价!加一箱油将多花约9.5元
- 台风“卡努”“兰恩”共舞,互相影响还是各走各的
- 美媒:美向乌援助总额已超662亿美元
- 铁路上海站官方微博,收到一条特殊的求助……
- 天津市药监局:深入开展药品安全巩固提升行动 全面系统排查治理各类风险隐患
- 光伏板下种菌菇 江西广昌“农光互补”照亮乡村振兴路
- 中颖电子(300327.SZ):公司在研的MCU主要是32位元的产品
- (空×胡桃)抱着胡桃抱枕被胡桃本人看见了之后……(上)
- 吉林四名大学生自费购买2500余件矿泉水 驾车11小时护送至灾区
- 8月9日华南地区顺酐市场行情下行
- 孟达是谁的部下(孟达是谁)
- 镇平县人大常委会对林业局开展工作评议
- 两部门:北京吉林四川等地部分地区发生地质灾害的气象风险较高
- 8月9日泰盛化工糠醇价格整理
- 苏试试验:上半年归母净利润1.36亿元,同比增27.82%,设备销售增长明显
- 8月9日金诚石化石脑油价格平稳
- 国家发改委等10部门印发《国家基本公共服务标准(2023年版)》
- 8月9日山东地区顺酐市场行情下行
- 国管公积金:2023住房公积金年度月缴存基数上限为33891元
- 8月9日中驰新材料石油焦价格平稳
- 阿拉丁: 西部证券股份有限公司关于上海阿拉丁生化科技股份有限公司2022年度持续督导工作现场检查报告
- 7月我国中小企业发展指数继续回升 专家解读→
- 在ppt中加入视频的格式(在ppt中加入视频)
- 2023天津海河游船演出季演出儿童可以看吗?
- 普京向俄杜马提交法律草案,提议进入战时状态无需再向欧洲委员会通报
- “两高”联合发布环境污染犯罪司法解释 调整污染环境罪定罪量刑标准
- 资阳:做优项目审批服务 打造一流营商环境
- 中银证券:预计CPI同比增速下半年有望波动上行
- 谭雅玲:7月份民企外贸贡献率达52.9%,我国与中亚五国贸易增长35%
- PPI和CPI底将先后形成
- 优酷注册妙鸭相机商标
- 从难点堵点出发 深化人脸信息保护
- 多管齐下提高居民可支配收入
- 我的世界信标怎么激活最高级效果(我的世界信标)
- 融信中国(03301.HK)前七个月合约销售额人民币107.36亿元
- 25国驻华使节参访新疆纪事 | 苏里南驻华大使张碧芬:我看到他们如何将传统与现代融合在一起
- 新消费观察丨Z世代年轻人下单代找理由“婉拒”无效社交:相亲脱身、逃离聚会…
- 市场监管总局:全面开展汛期食品安全隐患风险排查
- 理想的雄心与挚肘:李想放言明年销量超越BBA
- 新经济观察丨一个月卖出近4万单,江苏沭阳姐弟俩卖火单品遮阳网
- 买中南·智慧城二手房都要注意什么?
- 首个氢能标准建设指南出台,豪森股份已实现燃料电池产线全布局
- 圣晖集成业绩快报:上半年净利7706.76万元 同比增21.88%
- 浙商证券(601878.SH):控股股东及其一致行动人累计减持公司可转债756万张
- “红色物业”进小区
- 对话潘向东:活跃资本市场“工具箱”丰富 T+0有优先推出基础 |首席看市
- 有酒店书店还有托儿所!这家广州互联网企业“筑巢引凤”|现场+料
- 索尼PlayStation 5主机第一财季销量达到330万台
- 过敏多发 “元凶”就在身边新华网
- 多主力现身龙虎榜,京能置业跌停(08-09)
- 底盘零件股票概念有哪些?底盘零件股票一览
- 儿童健康智能与绿色生态圈融合发展高峰论坛隆重举行
- 中国34岁老将惹争议!张帅1-2被逆转,遭16连败,球迷怒批快退役
- 今天见证历史!一天10倍 最强新股盘中暴涨3700%
- 同和药业:公司获得欧洲药典适应性证书
- 长华集团:收到国内车企项目定点通知书
- 郑州高新区契税补贴在哪里申报啊?需要带什么材料?
- 中疾控:7月中国内地新增猴痘确诊491例,专家解读为何增加这么多
- 广达7月营收同比减少32.9%
- 《匹诺曹的谎言》开发已正式完成 9月19日如期发售
- 三星新拍摄模式曝光 可折叠手机将带新功能
- 宋朝和明朝之间相距不到100年,为什么给人一种恍如隔世的感觉!
- 红旗C801:华丽登场,挑战奔驰S级的高端座驾!
- 如何与财会监督贯通协作?山东省审计厅:深度融合、财审互动、系统施治
- ISC 2023 之中小微数字安全云论坛即将召开 业界将探讨数字转型新思路
- 公安部:各地出动警力80.5万人次做好防汛救灾工作
- 轻薄无短板折叠旗舰!雷军:小米MIX Fold 3转轴突破性创新
- 油市依旧上行趋势,维持高位震荡走势
- 王毅将访问新加坡、马来西亚和柬埔寨
- 江苏新潮村:三代村居“同框”,道出振兴“密码”
- 青春与梦想齐飞!苏州金龙圆满护航成都大运会
- 8月9日锌现期收盘行情
- 国内商品期货收盘涨多跌少 豆一等涨超2%
- 8月9日扬州实友苯酚价格下调
- 河南医科大学学院(河南医科大学官网)
- 8月第一周巴西出口玉米1318771吨
- 8月9日焦煤期货行情上涨
- 内蒙古大兴安岭林区发生森林火灾 正在紧张扑救
- 人脸识别技术应用安全管理规定征求意见:使用人脸识别应取得个人同意
- 南京稳楼市出实招:发放新房补贴 建立“安置房源超市”
- 回顾中国男网尴尬时刻,你会发现,现在的球迷很幸福(二)