面的商汤大爆款使用背设备

50%本钱节约 、爆款背面3~5倍推理时延下降、使用设备100%的爆款背面QPS(每秒请求数)提高!

由主意流打造的使用设备“造梦次元” ,是爆款背面由多模态。AI  。使用设备驱动的爆款背面新一代内容渠道,得益于商汤大设备AIGC解决方案从算力到模型的使用设备端到端支撑,经过算力和模型 、爆款背面模型和运用之间的使用设备严密协同 ,既发明了最佳的爆款背面用户体会 ,又获得了最大化的使用设备本钱效益,现在已成为一款日均活泼互动时刻超越100分钟的爆款背面现象级运用。

主意流合伙人、使用设备Studio负责人张鸿表明 :“商汤大设备展现出三重中心优势 :一是爆款背面算力与模型的深度协同 ,完成最高效的资源运用;二是针对文本、语音、图画等不同模态的协同 ,构建了流通天然的交互体会;三是支撑开源模型的完善生态,供给了多样化模型挑选 。这种多维度协同优势助力咱们完成了‘算力、模型、运用’三位一体的全链条优化 ,推进技能效能向商业价值的高效转化。”。

日均6000万次调用、千亿token耗费,带来三大「生计应战」 。

依据对用户需求的洞悉  ,主意流经过技能创新直击AI互动运用普遍存在的“沉溺感缺乏”和“门槛过高”两大中心问题。

例如 ,经过供给文字、语音 、文图结合的多模态交互,让用户与AI的互动体会趋近实在人际沟通 。此外,主意流还供给丰厚的创造东西 ,用户只需套用相关模板 ,就可快速建立完好互动内容  ,有用下降了创造门槛。

造梦次元每日均匀模型调用量高达6000多万次 ,一天耗费的token达千亿等级 。在如此巨大的规划下,任何卡顿、宕机 、犯错都会导致严峻的用户丢失;任何因模型才能缺乏形成的体会欠安,都会影响产品口碑;任何细小的资源搁置 ,都会累计成巨大的本钱开支。摆在主意流面前的“生计应战”,首要体现在三个层面 :

2倍峰谷差的算力弹性战 :造梦次元的渠道流量有着明显的潮汐特征 ,周末和节假日顶峰时段的流量可达低谷时期2倍 ,对基础设施算力资源有很强的弹性弹性需求 。

推理时延的2秒生死线:虚拟人物互动场景对时延极为灵敏,要保证根本流通的交互体会,模型推理时延需安稳控制在2秒以内 。

模型迭代的安稳性应战   :主意流采用了许多开源模型 ,需求跟从社区节奏进行频频晋级乃至替换。需求多 、更新频,怎么保证事务安稳运转也至关重要 。

顶峰秒级呼应不卡顿、低谷资源开释不糟蹋 。

商汤大设备作为“最懂大模型的AI基础设施” ,为主意流供给了从算力到模型的全链路一体化AIGC全体解决方案 ,一站式支撑主意流的产品研制及运营需求 ,做到“顶峰秒级呼应不卡顿、低谷资源开释不糟蹋” 。

秒级弹性弹性:本钱暴降50%,流量潮汐从容应对。

面临流量峰谷动摇应战 ,商汤大设备经过实时监测  、一致调度 、 。智能。扩缩容的组合战略 ,完成秒级弹性弹性 ,为主意流的全体运营本钱下降了50%。其间 ,智能化一致调度结合监测体系实时抓取的事务目标 ,依据推理事务扩缩容规矩主动分配资源 ,完成算力与流量的精准匹配;并结合守时扩缩容与按需扩缩容的两层战略 ,进一步提高弹性弹性的灵敏性 。

全链路优化 :5倍推理时延下降、100%QPS提高 。

主意流将“人均互动次数”作为判别模型体会的归纳目标 ,推理时延和QPS正是影响该目标的关键要素  。商汤大设备经过硬件资源、软件结构、 。算法 。模型等多维度协同优化,使推理时延下降3~5倍 。

别的 ,在秒级弹性弹性的基础上 ,商汤大设备还经过全链路量化加快、流量分级与降级等专项优化,可在顶峰期优先保证高价值事务的呼应速度,终究将QPS提高100%,以更快的呼应速度提高用户体会 。

商汤日日新多模型组合,“人均互动次数”翻倍提高。

“人均互动次数”另一个影响要素在于模型才能,商汤以商议言语大模型、商议拟人对话模型、文生图模型秒画等多模型组合 ,为造梦次元用户带来“更懂人心”的交互体会。

其间 ,商议言语大模型以精准的上下文语义剖析、目的推理及对人类情感的详尽感知与回应,助力造梦次元以拟人化思想打造沉溺式沟通体会。一起 ,依托商议拟人对话模型抢先的人物对话 、人设、及剧情推进才能 ,协助主意流用户打造IP人物 ,为用户供给高拟真对话体会。此外,创造者可运用秒画的一般生图  、CN生图 、换脸、扩图等功能,进行各类虚拟人物规划。

依据基础设施的体系优化和两边的模型共创 ,造梦次元的“人均互动次数”从初期20轮提高至40~50轮  ,用户粘性完成跨越式增加 。

牢靠全面安稳性保证:模型随时升,事务不断点 。

针对主意流高频次的模型切换,以及开源模型频频的版别晋级给事务运营带来的安稳性应战 ,商汤大设备针对推理阶段构建了包括模型灰度发布 、翻滚晋级与智能运维的全面安稳性保证体系 ,不仅为模型快速迭代供给了有用支撑,也保证了在线事务的安稳运转 。

日均活泼100分钟,构建新式内容消费生态。

短短两年时刻,“造梦次元”已展开成为具有数百个万粉等级IP人物,日均活泼互动时刻超越100分钟的运用渠道  ,是很多年青用户文娱、情感表达和学习陪练的重要同伴 。未来 ,两边还将聚集多模态模型才能深化协作 ,给用户带来更别致、更风趣的AI互动之旅 。

商汤 。科技。联合创始人、大设备工作群总裁杨帆以为:“商汤大设备与主意流的协作,是对商汤科技‘大设备-大模型-运用’三位一体战略价值的最佳诠释 。依据运用场景特色展开模型才能共创 ,练习高度贴合事务需求的垂类模型,并针对模型调用需求供给最优的基础设施支撑 ,给予灵敏的弹性弹性、极低的推理时延和安稳性保证 ,终究完成降本增效和用户满意度的提高 。大模型算法与基础设施的联合优化,不仅是驱动生成式AI展开的中心动力 ,也是完成最大化商业价值的最优途径 。”。

发表评论

您的电子邮件地址不会被公开 必填项已标记*