“有用”的算力“不好用”?
{news_date} 来源:

【导语】国产算力芯片以“能用、好用”为评价标杆,但“高性能”与“易用”间似存鸿沟。业内人士指出,国产算力为提升使用率,在软件栈设计上“有意”平衡,既要简化操作降低用户成本,又因场景多样、代际和异构差异面临挑战,实现“更好用”仍需突破。

对于国产算力芯片来说,“纸面上的指标不重要,真正能用、好用才重要”,几乎成为业界默认的评价标准。然而,近日记者从产业活动中了解到,算力的“高性能”和“易用”之间似乎存在着一道“看不见的鸿沟”。

好算力不易用,厂商有意为之?

“好用和用得好似乎是天然的矛盾。”摩尔线程联合创始人首席技术官张钰勃表示。对于用户而言,“好用”首先意味着使用和迁移成本低。要实现“好(hǎo)用(yòng)”,让(ràng)用(yòng)户(hù)先(xiān)在(zài)自(zì)己(jǐ)的(de)平台上“用起来”,算力芯片企业就得将自己的计算平台包装得非常简单,非常标准化,甚至做得跟CUDA一模一样。“这样开发者确实不需要做太多的额外学习,能够最小化(huà)学(xué)习(xí)和(hé)迁(qiān)移(yí)成(chéng)本(běn)。”张(zhāng)钰(yù)勃说。

小2.j

国产算力芯片用于数字人

然而,单纯与国际主流保持一致,国产算力的创新性如何体现?国产卡又如何真正实现在诸多应用场景的部署,成为“有用”算力呢?

针对这一问题,北京硅基流动科技有限公司创始人、首席执行官袁进辉解释道:算力芯片中(zhōng)往(wǎng)往(wǎng)会(huì)设(shè)计(jì)很(hěn)多(duō)细(xì)节(jié),存(cún)在(zài)很(hěn)多(duō)复(fù)杂(zá)的(de)结(jié)构(gòu)和(hé)功(gōng)能(néng),充(chōng)分(fēn)调(diào)用(yòng)其(qí)功(gōng)能(néng)需(xū)要一定的经验和技巧。如果想让更多的人尽快地用起来,芯片就要尽可能地把细节隐藏起来,用简单而(ér)抽(chōu)象(xiàng)的(de)指(zhǐ)令(lìng),尽(jǐn)可(kě)能(néng)让(ràng)使(shǐ)用(yòng)的(de)方(fāng)式(shì)简(jiǎn)单(dān)一(yī)些(xiē)。也(yě)就(jiù)是(shì)说(shuō),把(bǎ)软(ruǎn)件(jiàn)接(jiē)口(kǒu)做简单,使用户能“傻瓜式”地把芯片用起来,便实现了芯片的“好用”。

但算力芯片应用的场景是多样化的,场景覆盖AI、图形处理、科学计算等等诸多类型,每一种任务的工作负载不尽相同,对底层芯片的使用方式也各不相同。在不同的场景中,工程师如果发现了需要解决的问题,需要从上到下,逐层把一些工作负载细化、分解,以匹配硬件上的规格。

因此,所谓算力芯片“好用的没用”“有用的不好用”的争论,其实一定程度上是算力芯片企业为提升本品牌芯片使用率,“有意为之”的结果。

“好用不好用”,软件栈很重要

为了使用户先“用起来”而故意隐藏部分信息,既反映出算力芯片企业对用户的重视,也反映出用户习惯仍然在国产算力芯片普及化过程中扮演着相当重要的角色。软件栈的成熟度和“好用”程度,也很大程度上决定了开发者对算力芯片品牌的信赖度。

当前,用户期待算力基础设施能够承载包括大规模训练、推理在内的诸多职能。与此同时,国产算力芯片存在代际迭代,超智融合的算力中心还存在异构情况。上述这些需求,都对底层软件栈的稳定性带来很大的挑战。

“我们期待的状态是,上层应用跑得好。”启元实验室助理研究员王豪杰在接受采访时表示。英伟达的芯片之所以受到欢迎,稳定、高效且简易的软件栈发挥了很大的作用。王豪杰举例,一个在A100芯片上训练的模(mó)型(xíng),可以部署在4090显卡上,整个(gè)过(guò)程(chéng)非(fēi)常(cháng)顺(shùn)利(lì),不(bù)需(xū)要(yào)对(duì)软(ruǎn)件(jiàn)做(zuò)任(rèn)何(hé)修(xiū)改(gǎi)。“这(zhè)是(shì)英(yīng)伟(wěi)达(dá)好(hǎo)用(yòng)的本质核心。”王豪杰说。

小.j

国产算力用于远程作业平台

反观国产芯片(piàn)生(shēng)态(tài):一(yī)方(fāng)面(miàn),同(tóng)一(yī)品(pǐn)牌(pái)的(de)产(chǎn)品(pǐn)存(cún)在(zài)代(dài)际(jì)差(chà)异(yì);另(lìng)一(yī)方(fāng)面(miàn),不(bù)同(tóng)品(pǐn)牌(pái)之(zhī)间(jiān)、底(dǐ)层(céng)软(ruǎn)件(jiàn)栈(zhàn)之(zhī)间(jiān)也(yě)存(cún)在(zài)差(chà)异(yì)。在(zài)某(mǒu)一(yī)款(kuǎn)产(chǎn)品(pǐn)上(shàng)进(jìn)行(xíng)训(xun)练(liàn),再(zài)到(dào)另(lìng)一(yī)款(kuǎn)算(suàn)力(lì)芯(xīn)片(piàn)上(shàng)推(tuī)理(lǐ),模型在不同的软件和底层硬件迁移之后,精度损失会非常严重。甚至可能出现,某些接口在一款产品上适配了,但在另一款产品上没有适配,模型跑不起来的可能。

“在单点算力不足的情况下,为了满足算力规模需求,我们需要调用异构算力。底层软件的是支撑实现这一切的基础。”王豪杰称。

基于此,国产算卡要实现“更好用”,就得使任务能够轻易地调用不同品牌的算力卡。如果存在严格的适配机制和验证机制,能够通过中间层统一的架构,保障在上层代码不作修改的情况下,任务也能够在不同品牌的算力芯片上运转起来,便能推动我国智能算力进一步朝着产业化、规模化方向拓展。

需要的帮助

非常重视自身产品及用户体验,欢迎广大用户向我们提出相关产品及业务系统的意见和反馈,以帮助我们提升产品性能及用户体验。

首页 免费通话 联系我们