BMS, BUS, өнөр жай, прибордук кабель үчүн.

Жаз майрамы жакындап калганда, DeepSeekтин айланасындагы толкундануу күчтүү бойдон калууда. Жакында болгон майрам технология тармагындагы атаандаштыктын олуттуу сезимин баса белгилеп, көпчүлүк бул "сом балыкты" талкуулап, талдап чыгышты. Силикон өрөөнү болуп көрбөгөндөй кризис сезимин баштан кечирүүдө: ачык булактын жактоочулары кайрадан өз ойлорун айтышууда, жада калса OpenAI анын жабык булак стратегиясы эң жакшы тандоо болгонбу же жокпу, кайра карап чыгууда. Төмөнкү эсептөө чыгымдарынын жаңы парадигмасы Nvidia сыяктуу чип гиганттарынын арасында чынжыр реакциясын жаратты, бул АКШнын фондулук биржасынын тарыхында бир күндүк рыноктук жоготууларга алып келди, ал эми мамлекеттик органдар DeepSeek колдонгон чиптердин шайкештигин иликтеп жатышат. DeepSeekтин чет өлкөлөрдөгү аралаш сын-пикирлеринин алкагында, ал укмуштуудай өсүштү. R1 моделин ишке киргизгенден кийин, тиешелүү колдонмо трафиктин көбөйүшүн байкады, бул колдонмо секторлорунун өсүшү жалпы AI экосистемасын алдыга жылдырат. Оң жагы, DeepSeek колдонуу мүмкүнчүлүктөрүн кеңейтет, бул ChatGPT'ге таянуу келечекте анчалык кымбат эмес экенин көрсөтүп турат. Бул өзгөрүү OpenAIдин акыркы иш-чараларында, анын ичинде DeepSeek R1ге жооп катары колдонуучуларга акысыз o3-mini деп аталган ой жүгүртүү моделин берүү, ошондой эле o3-mini ой чынжырын жалпыга ачык кылган кийинки жаңыртуулар чагылдырылган. Көптөгөн чет элдик колдонуучулар DeepSeekке бул окуялар үчүн ыраазычылык билдиришти, бирок бул ой тизмеги кыскача маалымат катары кызмат кылат.
Оптимисттик жактан алганда, DeepSeek ата мекендик оюнчуларды бириктирип жатканы көрүнүп турат. Окутууга кеткен чыгымдарды кыскартууга басым жасоо менен, ар кандай жогорку чип өндүрүүчүлөр, аралык булут провайдерлери жана көптөгөн стартаптар DeepSeek моделин колдонуу үчүн сарптоолордун натыйжалуулугун жогорулатуу менен экосистемага активдүү кошулууда. DeepSeekтин документтерине ылайык, V3 моделин толук окутуу үчүн болгону 2,788 миллион H800 GPU саат талап кылынат жана окутуу процесси абдан туруктуу. Министрликтин (эксперттердин аралашмасы) архитектурасы 405 миллиард параметри бар Llama 3 менен салыштырганда окутууга чейинки чыгымдарды он эсеге кыскартуу үчүн өтө маанилүү. Азыркы учурда, V3 ЭМде мындай жогорку сейректикти көрсөткөн биринчи жалпыга таанылган модель. Кошумчалай кетсек, MLA (көп катмарлуу көңүл буруу) өзгөчө ой жүгүртүү аспектилеринде синергетикалык иштейт. "БМ канчалык сейрек болсо, эсептөө күчүн толугу менен колдонуу үчүн ой жүгүртүү учурунда талап кылынган партиянын көлөмү ошончолук чоң болот, KVCache өлчөмү негизги чектөөчү фактор болуп саналат; MLA KVCache өлчөмүн кыйла азайтат", - деп белгиледи Chuanjing Technology компаниясынын изилдөөчүсү AI Technology Review үчүн анализде. Жалпысынан, DeepSeekтин ийгилиги бир эле эмес, ар кандай технологиялардын айкалышында. Өнөр жайдын инсайдерлери DeepSeek командасынын инженердик мүмкүнчүлүктөрүн мактап, алардын параллелдүү окутуудагы жана операторду оптималдаштыруудагы мыктылыгын белгилеп, ар бир деталды тактоо аркылуу эң сонун натыйжаларга жетишет. DeepSeek'тин ачык булактуу мамилеси ири моделдердин жалпы өнүгүшүн андан ары өркүндөтөт жана эгер окшош моделдер сүрөттөргө, видеолорго жана башкаларга жайылса, бул тармак боюнча суроо-талапты олуттуу түрдө стимулдайт деп күтүлүүдө.
Үчүнчү тараптын ой жүгүртүү кызматтары үчүн мүмкүнчүлүктөр
Маалыматтар көрсөткөндөй, DeepSeek чыккандан бери 21 күндүн ичинде 22,15 миллион күнүмдүк активдүү колдонуучуларды (DAU) топтоп, ChatGPT'тин колдонуучу базасынын 41,6%га жеткен жана Doubao'нун 16,95 миллион күнүмдүк активдүү колдонуучуларынан ашып, дүйнө жүзү боюнча эң тез өнүгүп жаткан тиркеме болуп, Apple Store өлкөлөрүндө/региондорунда биринчи орунда турган15. Бирок, колдонуучулар топ-топ болуп агылып жатканда, кибер хакерлер DeepSeek колдонмосуна тынымсыз чабуул жасап, анын серверлерине олуттуу зыян келтиришти. Өнөр жай аналитиктери бул жарым-жартылай DeepSeek окуу үчүн карталарды жайылтуу менен шартталган, ал эми ой жүгүртүү үчүн жетиштүү эсептөө күчү жок деп эсептешет. Тармактын инсайдери AI Technology Reviewге мындай деп билдирди: "Серверде тез-тез көйгөйлөрдү жыйымдарды алуу же көбүрөөк машиналарды сатып алуу үчүн каржылоо аркылуу оңой чечсе болот; акыры, бул DeepSeekтин чечимдеринен көз каранды." Бул өндүрүшкө каршы технологияга басым жасоодо соодалашууну көрсөтөт. DeepSeek көбүнчө өзүн-өзү багуу үчүн кванттык квантташтырууга таянып, тышкы каржылоону аз алгандыктан, акча агымынын салыштырмалуу төмөн басымына жана таза технологиялык чөйрөгө алып келди. Учурда, жогоруда айтылган көйгөйлөрдү эске алуу менен, кээ бир колдонуучулар DeepSeekти социалдык медиада колдонуу босогосун жогорулатууга же колдонуучу жайлуулугун жогорулатуу үчүн акы төлөнүүчү функцияларды киргизүүгө үндөп жатышат. Кошумча, иштеп чыгуучулар оптималдаштыруу үчүн расмий API же үчүнчү тараптын API'лерин колдоно башташты. Бирок, DeepSeekтин ачык платформасы жакында жарыялады: "Учурдагы сервер ресурстары аз жана API кызматын толуктоо убактылуу токтотулду."
Бул, албетте, AI инфраструктура тармагындагы үчүнчү тараптын сатуучулары үчүн көбүрөөк мүмкүнчүлүктөрдү ачат. Жакында көптөгөн ата мекендик жана эл аралык булут гиганттары DeepSeekтин API моделдерин ишке киргизишти — чет элдик гиганттар Microsoft жана Amazon январдын аягында биринчилерден болуп кошулган. Ата мекендик лидер Huawei Cloud биринчи кадамды жасап, 1-февралда Silicon-based Flow менен биргеликте DeepSeek R1 жана V3 ой жүгүртүү кызматтарын чыгарды. AI Technology Review отчетторунда Silicon негизиндеги Flow кызматтары колдонуучулардын агымын көрүп, платформаны эффективдүү “бузду”. Үч чоң технологиялык компаниялар - BAT (Baidu, Alibaba, Tencent) жана ByteDance - ошондой эле 3-февралдан баштап арзан баада, чектелген убакыт сунуштарын чыгарышты, бул былтыркы DeepSeekтин V2 моделин ишке киргизгенден кийин тутанган булут сатуучулардын баасы согушун эске салат, DeepSeek "баа касапчысы" деп атала баштады. Булут сатуучуларынын ачуулуу иш-аракеттери Microsoft Azure жана OpenAI ортосундагы мурунку бекем байланыштарды кайталайт, мында 2019-жылы Microsoft OpenAIге 1 миллиард долларлык инвестиция салып, ChatGPT 2023-жылы ишке киргизилгенден кийин пайда көргөн. Бирок, бул тыгыз байланыш Meta ачык булактуу Llamaдан кийин бузула баштаган жана башка сатуучуларга Microsoftem Azureecs чоң моделдери менен атаандашууга мүмкүнчүлүк берген. Бул учурда, DeepSeek продуктунун жылуулугу боюнча ChatGPT'ден ашып гана тим болбостон, Llama's GPT-3ти кайра жанданткан толкундануу сыяктуу o1 релизинен кийин ачык булактуу моделдерди да киргизди.
Чындыгында, булут провайдерлери өздөрүн AI тиркемелери үчүн трафик шлюздары катары көрсөтүп жатышат, бул иштеп чыгуучулар менен байланышты тереңдетүү артыкчылыктарга ээ болот. Отчеттор көрсөткөндөй, Baidu Smart Cloud компаниясынын DeepSeek моделин Qianfan платформасы аркылуу колдонгон 15 000ден ашуун кардарлары моделдин ишке киргизилген күнү болгон. Кошумчалай кетсек, бир нече майда фирмалар чечимдерди сунуштап жатышат, анын ичинде Silicon-based Flow, Luchen Technology, Chuanjing Technology жана DeepSeek моделдерин колдоону ишке киргизген ар кандай AI Infra провайдерлери. AI Technology Review DeepSeekтин локализацияланган жайгаштырылышы үчүн учурдагы оптималдаштыруу мүмкүнчүлүктөрү биринчи кезекте эки багытта бар экенин билди: бири гибриддик GPU/CPU корутундусун колдонуу менен 671 миллиард параметр MoE моделин жергиликтүү түрдө жайылтуу үчүн аралаш ой жүгүртүү ыкмасын колдонуу менен ӨКМ моделинин сейрек мүнөздөмөлөрүн оптималдаштыруу. Мындан тышкары, MLA оптималдаштыруу абдан маанилүү болуп саналат. Бирок, DeepSeekтин эки модели дагы эле жайылтууну оптималдаштырууда кээ бир кыйынчылыктарга туш болушат. Chuanjing Technology компаниясынын изилдөөчүсү: "Моделдин көлөмүнө жана көптөгөн параметрлерине байланыштуу, оптималдаштыруу чындыгында татаал, өзгөчө жергиликтүү орнотуулар үчүн, анда натыйжалуулук менен баанын ортосундагы оптималдуу баланска жетүү кыйынга турат" деди. Эң негизги тоскоолдук эс тутумдун мүмкүнчүлүктөрүн чектөө болуп саналат. "Биз CPU жана башка эсептөө ресурстарын толугу менен пайдалануу үчүн гетерогендүү кызматташуу ыкмасын колдонобуз, сейрек МЭ матрицасынын бөлүштүрүлбөгөн бөлүктөрүн гана CPU/DRAMга жогорку өндүрүмдүүлүктөгү CPU операторлорунун жардамы менен иштетүү үчүн жайгаштырабыз, ал эми жыш бөлүктөрү GPUде калат", - деп түшүндүрдү ал андан ары. Отчеттор көрсөткөндөй, Chuanjing's ачык булактуу KTransformers негизи ар кандай стратегияларды жана операторлорду калып аркылуу баштапкы Transformers ишке ашырууга киргизип, CUDAGraph сыяктуу ыкмаларды колдонуу менен тыянак чыгаруунун ылдамдыгын кыйла жогорулатат. DeepSeek бул стартаптар үчүн мүмкүнчүлүктөрдү түздү, анткени өсүш пайдалары айкын болуп баратат; көптөгөн фирмалар DeepSeek API ишке киргизгенден кийин, оптималдаштырууну издеп жаткан мурунку кардарлардын суроо-талаптарын алгандан кийин кардарлардын байкалаарлык өсүшүн билдиришти. Өнөр жайдын инсайдерлери белгилегендей, "Мурда бир аз түзүлгөн кардар топтору чоңураак компаниялардын стандартташтырылган кызматтарына камалып калышкан, алар масштабдуу болгондугуна байланыштуу алардын наркынын артыкчылыктары менен тыгыз байланышта болчу. Бирок, DeepSeek-R1/V3 жаз майрамына чейин жайгаштырууну аяктагандан кийин, биз күтүлбөгөн жерден бир нече белгилүү кардарлардан кызматташуу өтүнүчтөрүн алдык, ал тургай DeSeep кызматын сунуштаган кардарларыбыздын демилгечилери." Азыркы учурда, DeepSeek моделдик жыйынтыктын натыйжалуулугун барган сайын критикалык кылып жатат окшойт жана чоң моделдердин кеңири кабыл алынышы менен бул AI Infra индустриясынын өнүгүшүнө олуттуу таасирин тийгизет. Эгерде DeepSeek деңгээлиндеги моделди жергиликтүү деңгээлде арзан баада жайылтуу мүмкүн болсо, бул мамлекеттик жана ишканалардын санариптик трансформациялоо аракеттерине чоң жардам бермек. Бирок, кыйынчылыктар уланууда, анткени кээ бир кардарлар чоң моделдин мүмкүнчүлүктөрүн жогору күтүшү мүмкүн, бул иш жүзүндө жайылтууда натыйжалуулук менен чыгымды тең салмактоо өтө маанилүү болуп калат.
DeepSeek ChatGPTге караганда жакшыраак экенине баа берүү үчүн, алардын негизги айырмачылыктарын, күчтүү жактарын жана колдонуу учурларын түшүнүү керек. Бул жерде комплекстүү салыштыруу:
Өзгөчөлүк/Аспект | DeepSeek | ChatGPT |
---|---|---|
Менчик | Кытай компаниясы тарабынан иштелип чыккан | OpenAI тарабынан иштелип чыккан |
Булак модели | Ачык булак | Менчик |
Наркы | Колдонуу акысыз; арзаныраак API мүмкүнчүлүктөрү | Жазылуу же колдонуу үчүн акы төлөө |
Ыңгайлаштыруу | Абдан ыңгайлаштырылган, колдонуучуларга аны өзгөртүүгө жана курууга мүмкүндүк берет | Чектелген ыңгайлаштыруу жеткиликтүү |
Конкреттүү тапшырмаларды аткаруу | Маалыматтарды талдоо жана маалымат издөө сыяктуу белгилүү бир чөйрөлөрдө Excels | Чыгармачыл жазуу жана сүйлөшүү тапшырмаларында күчтүү аткаруу менен ар тараптуу |
Тилди колдоо | Кытай тилине жана маданиятына катуу көңүл бурулат | Кеңири тилди колдоо, бирок АКШга багытталган |
Окутуу баасы | Төмөнкү окутуу чыгымдары, натыйжалуулук үчүн оптималдаштырылган | олуттуу эсептөө ресурстарын талап кылган жогорку окуу чыгымдар |
Жооптун өзгөрүшү | Мүмкүн геосаясий контексттин таасири астында ар кандай жоопторду сунуштайт | Окутуу маалыматтарынын негизинде ырааттуу жооптор |
Максаттуу аудитория | Ийкемдүүлүктү каалаган иштеп чыгуучуларга жана изилдөөчүлөргө багытталган | Сүйлөшүү мүмкүнчүлүктөрүн издеген жалпы колдонуучуларга багытталган |
Use Cases | Кодду түзүү жана тез тапшырмалар үчүн натыйжалуураак | Текст түзүү, суроолорго жооп берүү жана диалог жүргүзүү үчүн идеалдуу |
"Nvidia-ны бузууга" критикалык көз караш
Учурда Huaweiден тышкары Moore Threads, Muxi, Biran Technology жана Tianxu Zhixin сыяктуу бир нече ата мекендик чип өндүрүүчүлөр дагы DeepSeekтин эки моделине ыңгайлашууда. Чип өндүрүүчүсү AI Technology Review басылмасына мындай деди: "DeepSeekтин түзүмү инновацияларды көрсөтөт, бирок ал LLM бойдон калууда. Биздин DeepSeekке ыңгайлашканыбыз, биринчи кезекте, акыл-эстүү колдонмолорго багытталган, бул техникалык ишке ашырууну кыйла жөнөкөй жана тез кылат." Бирок, Министрликтин мамилеси сактоо жана бөлүштүрүү жагынан жогорку талаптарды талап кылат, ошондой эле ата мекендик микросхемаларды орнотууда шайкештикти камсыз кылуу менен бирге, адаптациялоо учурунда чечүүнү талап кылган көптөгөн инженердик көйгөйлөрдү жаратат. "Учурда ата мекендик эсептөө күчү Nvidiaга ыңгайлуулугу жана туруктуулугу боюнча дал келбейт, бул программалык чөйрөнү орнотуу, көйгөйлөрдү жоюу жана фундаменталдык иштөөнү оптималдаштыруу үчүн баштапкы заводдун катышуусун талап кылат", - деди тармактык практик практикалык тажрыйбанын негизинде. Ошол эле учурда, "DeepSeek R1 чоң параметр масштабынан улам, ата мекендик эсептөө күчү параллелдөө үчүн көбүрөөк түйүндөрдү талап кылат. Мындан тышкары, ата мекендик аппараттык спецификациялар дагы эле бир аз артта калды; мисалы, Huawei 910B учурда DeepSeek тарабынан киргизилген FP8 корутундусун колдой албайт." DeepSeek V3 моделинин урунттуу учурларынын бири - бул FP8 аралаш тактыктагы окутуу негизин киргизүү, ал абдан чоң моделде натыйжалуу текшерилип, олуттуу жетишкендикти белгилейт. Буга чейин, Microsoft жана Nvidia сыяктуу негизги оюнчулар тиешелүү иштерди сунушташкан, бирок өнөр жайдын ишке ашуусу боюнча күмөн саноолор бар. INT8 менен салыштырганда, FP8дин негизги артыкчылыгы - машыгуудан кийинки кванттоо дээрлик жоготуусуз тактыкка жетиши мүмкүн, ошол эле учурда жыйынтык чыгаруу ылдамдыгын олуттуу жогорулатат. FP16 менен салыштырганда, FP8 Nvidia'нын H20 ылдамдыгын эки эсеге чейин жана H100дө 1,5 эседен ашык ылдамдата алат. Баса, ата мекендик эсептөө кубаттуулугу жана ата мекендик моделдер тенденциясын курчап турган талкуулар күчөгөн сайын, Nvidia үзгүлтүккө учурашы мүмкүнбү же CUDA чуңкурун айланып өтсө болобу деген божомолдор барган сайын күч алууда. Бир талашсыз чындык, DeepSeek чындап эле Nvidiaнын рыноктук наркынын олуттуу төмөндөшүнө алып келди, бирок бул жылыш Nvidia'нын жогорку деңгээлдеги эсептөө күчү бүтүндүгүнө байланыштуу суроолорду жаратат. Капиталга негизделген эсептөө топтоо боюнча мурда кабыл алынган баяндар талашка түшүп жатат, бирок Nvidia үчүн окуу сценарийлеринде толук алмаштыруу кыйын бойдон калууда. DeepSeekтин CUDAны терең колдонуусунун талдоосу, ийкемдүүлүк (мисалы, байланыш үчүн SM колдонуу же тармактык карталарды түздөн-түз манипуляциялоо) кадимки GPU'ларга ылайыктуу эмес экенин көрсөтүп турат. Өнөр жайдын көз караштары Nvidia'нын чуңкуру CUDAнын өзүн эле эмес, бүт CUDA экосистемасын камтый турганын баса белгилешет жана DeepSeek колдонгон PTX (Parallel Thread Execution) нускамалары дагы эле CUDA экосистемасынын бир бөлүгү болуп саналат. "Кыска мөөнөттө, Nvidia'нын эсептөө күчүн кыйгап өтүүгө болбойт - бул окутууда өзгөчө айкын; бирок, ой жүгүртүү үчүн ата мекендик карталарды колдонуу салыштырмалуу жеңил болот, андыктан прогресс тезирээк болот. Ата мекендик карталардын адаптацияланышы, биринчи кезекте, тыянак чыгарууга басым жасайт; эч ким DeepSeekтин иштөө моделин ата мекендик технологиялар боюнча үйрөтө алган жок". Жалпысынан алганда, бир тыянак көз карашынан алганда, жагдайлар ата мекендик ири модели чиптер үчүн бекемдейт. Ата мекендик чип өндүрүүчүлөрдүн тыянак чөйрөсүндөгү мүмкүнчүлүктөрү окууга кирүүсүнө тоскоолдук кылган өтө жогорку талаптардан улам айкыныраак. Аналитиктердин ырасташынча, жөн гана ата мекендик корутунду карталарын колдонуу жетиштүү; зарыл болсо, кошумча машинаны алуу мүмкүн, ал эми окутуу моделдери уникалдуу кыйынчылыктарды туудурат - машиналарды көбөйтүү түйшүктүү болуп калышы мүмкүн жана каталардын жогорку деңгээли окуунун натыйжаларына терс таасирин тийгизиши мүмкүн. Тренингде ошондой эле кластердик масштабдын конкреттүү талаптары бар, ал эми кластерлерге тыянак чыгаруу үчүн талаптар анчалык катуу эмес, ошондуктан GPU талаптарын жеңилдетет. Азыркы учурда, Nvidia жалгыз H20 картасынын өндүрүмдүүлүгү Huawei же Кембриандыкынан ашпайт; анын кучу — кластердик. Эсептөө энергиясы рыногуна жалпы таасирдин негизинде, Luchen Technology компаниясынын негиздөөчүсү Ю Ян, AI Technology Review менен болгон маегинде мындай деп белгиледи: "DeepSeek ультра чоң окутуучу эсептөө кластерлерин түзүүгө жана ижарага убактылуу зыян келтириши мүмкүн. Узак мөөнөттүү келечекте, чоң моделдерди окутуу менен байланышкан чыгымдарды олуттуу кыскартуу менен, рыноктук суроо-талаптар жана AI-га негизделген өтүнмөлөр. Демек, бул эсептөө электр рыногунда туруктуу суроо-талапты тынымсыз алып келет." Кошумчалай кетсек, "DeepSeekтин ой жүгүртүү жана тактоо кызматтарына болгон жогорулаган суроо-талаптары жергиликтүү мүмкүнчүлүктөр салыштырмалуу алсыз болгон жергиликтүү эсептөө ландшафтына көбүрөөк шайкеш келет, бул кластердик түзүлүштөн кийинки бош турган ресурстардын калдыктарын азайтууга жардам берет; бул ар кандай деңгээлдеги өндүрүүчүлөр үчүн мүмкүнчүлүктөрдү түзөт ата мекендик эсептөө экосистемасынын." Luchen Technology компаниясы Huawei Cloud менен кызматташып, DeepSeek R1 сериясынын логикалык API'лерин жана ички эсептөө кубаттуулугуна негизделген булутту сүрөттөө кызматтарын ишке киргизди. Сиз Янг келечекке карата оптимисттик көз карашын билдирди: "DeepSeek келечектеги ички эсептөө мүмкүнчүлүктөрүнө көбүрөөк шыктанууну жана инвестицияны кубаттап, ата мекендик өндүрүштөгү чечимдерге ишенимди жаратат."

Корутунду
DeepSeek ChatGPTге караганда "жакшы" болобу, колдонуучунун конкреттүү муктаждыктарына жана максаттарына жараша болот. Ийкемдүүлүктү, арзан бааны жана ыңгайлаштырууну талап кылган тапшырмалар үчүн DeepSeek жогору болушу мүмкүн. Чыгармачыл жазуу, жалпы сурамжылоо жана колдонуучуга ыңгайлуу сүйлөшүү интерфейстери үчүн ChatGPT жетектей алат. Ар бир курал ар кандай максаттарга кызмат кылат, ошондуктан тандоо алар колдонулган контекстке жараша болот.
Башкаруу кабелдери
Структураланган кабель системасы
Тармак жана маалыматтар, була-оптикалык кабель, патч-корд, модулдар, фасеплейт
Apr.16th-18th, 2024 Дубайда Жакынкы Чыгыш-Энергия
16-18-апрель, 2024-жыл, Москвада Секурика
9-май, 2024-жыл Шанхайда ЖАҢЫ ПРОДУКЦИЯЛАР ЖАНА ТЕХНОЛОГИЯЛАРДЫ БЕРҮҮ ОКУЯСЫ
Oct.22nd-25th, 2024 SECURITY CHINA Пекинде
19-20-ноябрь, 2024 БАЙЛАНЫШКАН ДҮЙНӨ KSA
Посттун убактысы: 2025-жылдын 10-февралына чейин