Deepseek: AI пейзажын револютизациялоо

Aipu Waton Group

Киришүү

Рыноктук үлүш үчүн атаандашкан чоң моделдер, булут провайдерлеринин арасында тынымсыз, булут провайдерлеринин жана эмгекчил чип өндүрүүчүлөрдүн ишин өндүрүүчүлөрдүн баш тамгаларынын таасири.

Жаздын майрамы жакындап калгандыктан, анын айланасындагы толкундануу күчтүү бойдон калууда. Акыркы майрам техникалык өнөр жайдын алкагында атаандаштык сезимин баса белгилеген, алар "сомду" талкуулап, талдоо менен талкуулашты. Силикон өрөөнү болуп көрбөгөндөй кризистин сезүү сезимин сезип жатат: ачык булактын жактоочулары өз ой-пикирлерин кайрадан жеп жатышат, ал тургай, ачык булак стратегиясын эң жакшы тандоо деп эсептешет. Төмөнкү эсептүү чыгымдардын жаңы парадигмасы NVIDIA сыяктуу бир күндүк рыноктук нарктын зыяндарын эсепке алуу үчүн чынжыр реакциясын алып келди, ал эми мамлекеттик органдар адеп-авиакомпаниялар Defectsek колдонгон чиптердин шайкештигин иликтөөдө. Чет өлкөдө, ички дипсиктин аралаш сын-пикирлеринин арасында, ал өзгөчө өсүшкө учурап жатат. R1 моделинин башталышынан кийин, ага байланыштуу колдонмо трафиктин соргучун көрдү, ал өтүнмөнүн тармактарынын өсүшү AI экосистемасын алдыга жылдырат. Оң аспекттын бул тереңдиги колдонмолорду кеңейтет, бул чатырга таянып, келечекте кымбат эмес деп айтууга болот. Бул сменанын акыркы иш-аракеттеринде, анын ичинде O3-Mini, ошондой эле Deepseek R1ге жооп катары O3-Mini, ошондой эле O3-Mini коомчулуктун ой жүгүртүүсүнө жооп берген акыркы иш-чараларга, ошондой эле кийинки иш-чараларга карата ой жүгүртүү моделин көрсөттү. Көптөгөн чет өлкөлөрдө колдонуучулар бул окуялар үчүн терең тереңдикке ыраазычылык билдиришти, бирок бул ой жүгүртүүчү чынжыр катары кызмат кылат.

Оптимисттик эмес, бул терең тема үй-бүлөлүк оюнчуларды бириктирип жатат. Тапшырма чипти, ар кандай жогорку түшүмүн өндүрүүчүлөрдүн, ар кандай жогорку түшүмдүүлүктү азайтууга багытталган Дипсектин документтеринин айтымында, V3 моделин толук окутуу үчүн 2,788 миллион H800 GPU саатын гана талап кылат, ал эми окуу процесси өтө туруктуу. MOE (эксперттердин аралашмасы) Архитектура, 405 миллиард параметрлер менен салыштырганда онго чейинки чыгымдарды онго чейинки чыгымдарды азайтуу үчүн архитектура бар. Учурда, V3 - бул Моедеги ушунчалык жогорку чек араны көрсөткөн биринчи элге ачык таанылган модель. Андан тышкары, MLA (Көп катмар көңүл буруу) синергикалык, айрыкча, ой жүгүртүүчү аспекттер менен иштейт. "ЭМНЕ ҮЧҮН МОМЕГИ КОРКУНУЧУ МЕНЕН ЧЫГАРУУЧУЛАРДЫН КӨБҮРӨӨК МААЛЫМАТТУУ КҮНДӨРДҮ КАБАРЧЫ МААЛЫМАТТУУ КОРКУНУЧУ МААЛЫМАТТУУ МААЛЫМАТТУУ КОРКУНУЧУ МААЛЫМАТТУУ КҮНДҮН АЧУУЧУ МААЛЫМАТТУУЧУ МААЛЫМАТТАРЫ; МЛА КУУАНГИНГ ТЕХНОЛОГИЯСЫ АИ Технологияны карап чыгуу үчүн изилдөөчү версиясын белгилейт. Жалпысынан, тереңдиктердин ийгилиги бир гана эмес, ар кандай технологиялардын айкалышында ар кандай технологиялардын айкалышында. Өнөр жай инсайдерлери спектакльдик машыгуунун жана оператордун оптимизациялоонун өркүндөтүлүшүн белгилеп, ар кандай деталдарды тазалоо үчүн, ар кандай деталдарды тазалоо үчүн, пайда болгон натыйжаларды алып салууга жетишти. Деңиздин ачык булактуу мамилеси андан ары ири моделдердин жалпы өнүгүүсүн андан ары өрчүтөт жана ушул сыяктуу моделдер бул сыяктуу моделдер болсо, бул тармакта суроо-талап бир кыйла стимулдайт деп болжолдонууда.

Үчүнчү тараптын ой жүгүртүүсү үчүн мүмкүнчүлүктөр

Маалыматтар, ал эми дебсек, дебектин 41,65 миллион жигердүү колдонуучулары (DAU) 41,65 миллионго жеткенден кийин, Даубаондун күн сайын 16,9% ы доуба-глобалдык өнүгүп келе жаткан колдонуучуларга жетишкенин көрсөтүп турат. Бирок, колдонуучулар айдоочуларга агып кетишкенде, кибер чөптөрдүн катаал колдонмосуна кол салып, серверлерине олуттуу штаммга алып келишкен. Өнөр жай талдоочулары бул жарым-жартылай ой жүгүртүү үчүн жетиштүү эсептөө күчү жетишпегендиктен, карточкаларды жайылтуу үчүн карточкаларды жайылтуу үчүн карточкаларды жайылтууга байланыштуу Инсайдердин инсайдери AI технологиясын карап чыгышты "," тез-тез сервердик маселелерди тездетүү же көбүрөөк машиналарды сатып алуу үчүн тезирээк чечүүгө болот; акыры, бул тереңдиктердин чечимине байланыштуу. " Бул технологияны натыйжалуу өнүктүрүүгө көңүл буруу үчүн соода жүргүзүлөт. Депсек, негизинен, өздүк ырысым алгандыгы үчүн өз алдынча кыянаттык менен камсыз кылуу үчүн квалттык иш-аракетине ишенип, анын натыйжасында акча агымынын кысымына жана таза технологиялык айлана-чөйрөгө алып келет. Учурда, жогоруда аталган көйгөйлөрдүн негизинде айрым колдонуучулар колдонуу босогосун көтөрүү үчүн, социалдык медиага тереңдеп жатышат же Колдонуучунун жайлуулугун жогорулатуу үчүн акы төлөнүүчү функцияларды киргизүү. Мындан тышкары, иштеп чыгуучуларга оптималдаштыруу үчүн API же үчүнчү тараптын уъленти колдонууну колдоно башташты. Бирок жакында "Учурдагы сервер ресурстары жетишсиз, API кызматын заряддалап алуу токтотулду", - деп жарыялаган тереңдиктердин ачык аянтчасы

 

Бул, албетте, Айдын инфраструктурасы тармагында үчүнчү тарапка сатуучуларга көбүрөөк мүмкүнчүлүктөрдү ачат. Жакында, ата мекендик жана эл аралык булут алптар Deepseekтин Deepse-Terversas Giants компаниясынын чет өлкөдөгү линиялары үчүн Microsoft жана Amazon компаниясынын январдын аягында биринчи кезекте кирди. 1-февралда ата мекендик лидер биринчи кадамды, дөңсөөнү 5-февралга чейин биргелешип кызматтан бошоткон биринчи кадамды, дебричтин негиздөөчү кызматты басып өттү. Айсологиянын обзорунун отчеттору Силикон агымдын агымын, натыйжалуу "кыйроо" платформасын натыйжалуу көрбөгөндүгүн көрсөттү. 3-февралга чейин былтыркыга чейин, былтыркы булут сатуучуга, анда Deepseek's V2 моделин баштаганга чейин, былтыркы булут сатуучу баанын арзандатылган Сунушталган чыгымдары, ал эми былтыркы убакта чектелген убакыт сунуштары, ал жерде Deepsek деп аталат. Microsoft Arapy жана Ocazai жана Ociali компаниясынын иретинен жасалган карама-каршылыктардын бири - Метро Мета менен биргелешкен мамилелер Мета ачык ллама менен биргелешип, бул жакыныраак мамиле түзө баштады. Бул учурда, Deepseek Өнүмдүн ысыкчылыгы жагынан чатырды ашып салган жок, бирок ошондой эле ломанын GPT-3-ж.

 

Чындыгында, булут провайдерлери өздөрүн АИдин өтүнмөлөрүнө жол кыймылы катары жайгаштырышат, демек, иштеп чыгуучулар менен байланышты тереңдетүү артыкчылыктарга которууну билдирет. Отчеттор Байду акылдуу булут 1ден ашуун кардарлар Липсек моделин Моделдин башталышында уча баштоо күнү менен колдонгон 15000ден ашык кардарлар болгонун көрсөтөт. Мындан тышкары, бир нече кичинекей фирмалар, кремнийге негизделген агым, лехен технологиясы, Чуан технологиясы, Чуан технологиясы, Чуан Технологиясы жана Deepseek моделдерин колдоо үчүн ар кандай AI инфра провайдерлери сунушталат. AI технологиясын карап чыгуу, биринчи кезекте, биринчи кезекте эки багытта оптимизация мүмкүнчүлүктөрүн оптимизациялоо мүмкүнчүлүктөрү бар экендигин бирден-бир модер моделинин мобилдүүлүгүн колдонуп, Мо Моф моделин колдонуп, мое моделинин мобилдүүлүгүн колдонуп, ме моделинин мобилдүүлүгүн колдонуп, мое моделинин мобилдүүлүгүн колдонуп оптимизациялоо. Мындан тышкары, Мла оптимизациясы өтө маанилүү. Бирок, тереңдиктин эки моделинин эки моделди жайылтууда оптимизациялоодо бир катар кыйынчылыктарга туш болгон. "Моделдин көлөмүнө жана көптөгөн параметрлерине байланыштуу, оптимизация, чындыгында, комплекстүү комплекси, айрыкча, спектаклдин жана нарктын ортосундагы оптималдуу баланска жетишүү үчүн," Чуан Технология технологиясынын изилдөөчүсү "деп билдирди. Эстутумдун кубаттуулугун арттырып жаткан эң маанилүү тоскоолдук. "Биз CPU жана башка эсептөө ресурстарын толугу менен пайдаланууга гетеррациялык кызматташтыкты толугу менен колдонууга, CPU / DRAM операторлорун иштетүү үчүн бир гана бөлүктөн турган бөлүктөрдү гана жайгаштырабыз, ал эми GPUда калып калгандыктан, GPUда калып калышат," Отчеттордун көрсөткүчү ЧуанФормерлер КТРАННФОРЛОРЛОРДОРУ Шаблон аркылуу Транзформаторлор аркылуу ар кандай стратегияларды жана операторлорду търлёлёрдёгърисе предметтерин търгёнън инфекциясын бир кыйла жогорулатуу, корутунду ылдамдыгын колдонууга олуттуу жетиштим. Дипсек бул баштоо үчүн мүмкүнчүлүктөрдү түздү, анткени өсүү жеңилдери көрүнүп турат; Көпчүлүк фирмалар, Deepseek APIди иштеткенден кийин кардарлардын өсүшү байкалууда, мурунку кардарлардан оптимизацияны издеп көрүүнү суранам. Өнөр жай инсайдерлерин белгилешти ", - деп белгилешти. Учурда бул тереңдиктердин натыйжалуулугун жогорулатуу иш-аракеттери барган сайын олуттуу сын-пикирлөөнү жана ири моделдерди кабыл алуу менен, бул ири инфра индустриясындагы өнүгүүгө олуттуу таасирин тийгизет. Эгерде DeepsEek деңгээлиндеги моделдин жергиликтүү деңгээлде жайгаштырылышы мүмкүн болсо, анда ал өкмөттүн жана ишкананын санариптик трансформациялоо аракеттери. Бирок, айрым кардарлар чоң моделдин мүмкүнчүлүктөрүнө байланыштуу жогорку күтүүлөрдү өткөрүшү мүмкүн, анткени ал тең салмактуулукка жана чыгымдын практикалык жайылтууну эске алуу менен, аны көбүрөөк билип турушу мүмкүн. 

Deepseek чаткадан артык деп баалоо үчүн, алардын негизги айырмачылыктарын, күчтүү жактарын жана иштерди колдонууну түшүнүү керек. Бул жерде комплекстүү салыштыруу:

Өзгөчөлүгү / аспект Deepseek Чаткаф
Ээлик Кытай компаниясы тарабынан иштелип чыккан Ococai тарабынан иштелип чыккан
Булак модели Ачык булак Peroprietar
Баасы Колдонууга акысыз; API мүмкүндүк алуу параметрлери Жазылуу же төлөө үчүн төлөнүүчү баа
Ыңгайлаштыруу Колдонуучуларга Tweak жана ага курууга мүмкүнчүлүк берүү Чектелген ыңгайлаштыруу
Конкреттүү тапшырмалардагы аткаруу Маалымат аналитикасы жана маалыматтык издөө сыяктуу белгилүү бир аймактарда жогору Чыгармачыл жазуу жана сүйлөшүү тапшырмаларында күчтүү спектакль менен туруктуу иштеши бар
Тил колдоо Кытай тилине жана маданиятына күчтүү көңүл буруңуз Кеңири тилди колдоо, бирок АКШ-центрдик
Окуу баасы Натыйжалуулук үчүн оптималдаштырылган окуу чыгымдары Жогорку окуу чыгымдары, бир кыйла маанилүү ресурстарды талап кылат
Жооп өзгөрүү Ар кандай жоопторду сунушташы мүмкүн, анча геосаясий контекстке таасир этиши мүмкүн Окуу маалыматтары боюнча ырааттуу жооптор
Максаттуу аудитория Ийкемдүүлүктү каалаган иштеп чыгуучуларга жана изилдөөчүлөргө багытталган Жалпы колдонуучуларга көздөө мүмкүнчүлүктөрүн издөөгө багытталган
Иштерди колдонуу Кодду муунга жана тез тапшырмаларга көбүрөөк натыйжалуу Текстти жаратуу үчүн идеалдуу, сурамжылоо жана диалогго катышуу үчүн идеалдуу

"Нвидияны бузуу" боюнча критикалык көз караш

Азыркы учурда, Хуавейден тышкары, жергиликтүү төрөлгөн, Мекси, Биран технологиясы сыяктуу бир нече ички чип өндүрүүчүлөрү жана Тянсу Жихиксин тереңдиктердин эки моделине ылайыкташтырылууда. "Дипсек түзүлүшү" техникасынын түзүлүшүн карап чыгып, "Дипсек түзүлүшү инновацияны карайт деп билдирди. Бирок, MOE ыкмасы сактоо жагынан, бөлүштүрүү жана бөлүштүрүү жагынан жогору талап кылынган, ата мекендик чиптер менен шайкештикти камсыз кылуу, адаптация учурунда токтомго муктаж болгон көптөгөн инженердик кыйынчылыктарды сунуштайт. "Учурда ички эсептөө күчү NVIDIA программасына жана туруктуулукка шайкештикке дал келбейт, программалык камсыздоону орнотуу, көйгөйлөрдү жана негиздөөчү иштин оптимизациясына оригиналдуу катышууну талап кылат", - деди өнөр жай практикасы практикалык тажрыйбага негизделген. Бир эле учурда, "Депрелчиликтин ири параметринин масштабынан улам, ички эсептөө кубаттуулугуна байланыштуу, ата мекендик жабдыктардын өзгөчөлүктөрү дагы бир аз чегин талап кылат; мисалы, Deepseek киргизилген FP8ди колдой албайт". Deepseek V3 моделинин эң негизги учурларынын бири - бул чоң жетишкендикти белгилөө үчүн, FP8 аралаш даярдалган трекациялык программасын киргизүү - бул чоң жетишкендикке ээ болгон FPENAL PRECCION TRUCION TRECION TRUCION программасын киргизүү. Буга чейин Microsoft жана NVidia сыяктуу негизги оюнчулар менен байланышкан ишти сунушташты, бирок техникалык-экономикалык негиздемеге байланыштуу өнөр жайдын чегинде шек санашат. INT8, FP8дин негизги артыкчылыгына салыштырмалуу, окутуудан кийинки жетишкендиктердин алдын-ала жетишсиз так аныкталышы мүмкүн, бирок тез арада ылдамдыкты жогорулатуу ылдамдыгын жогорулатат. FP16, FP8 Нвидиядагы H20 жана 1,5 эседен ашуун ылдамдануу үчүн эки эселенген ылдамдыктагы эки эселенген ылдамдыкты ишке ашырса болот. Белгилей кетчү нерсе, ички эсептөө кубатынын плюс, ата мекендик коммуналдык моделдер катары, нвидиданын бузулушу мүмкүнбү же жокпу деген божомолдорго ээ болуучу, божомолдорду божомолдоого болот. Бул тереңдикте, бул терең Нвидианын базар наркынын олуттуу төмөндөшүнө алып келген, бирок бул өзгөрүү Нвидиядагы эң акыркы эсептөө кубаттуулугуна байланыштуу суроолорду жаратат. Мурда капиталдык башкарылуучу эсептөөчү топтолушуна байланыштуу баяндалган баяндалган баяндалган, бирок ал Нвидиа үчүн толук сценарийлерге толук алмаштырылууга кыйын бойдон калууда. Дипсектин бейзин терең пайдасын талдоо көрсөткөндөй, бул ийкемдүүлүктү, мисалы, байланыш үчүн SM аркылуу же тармактык карталарды түздөн-түз маниптүүлүктү колдонуп, кадимки GPU үчүн мүмкүн эмес. Өнөр жайдык көз караштары Адилдин бейда тутумун жана PTX (параллелдүү темир жол-жоболоштуруу) деген көрсөтмөлөрдүн бардыгын (параллелдүү жолдоштуруу) (параллелдүү жипти аткаруу) көрсөтмөлөрүн баса белгилешет. "Кыска мөөнөттүү мезгилде, Нвидиядагы эсептөө күчү айкын болушу мүмкүн эмес. Жалпысынан, корутунду көз карашынан, ички ири моделдик чиптерин кубаттандырат. Ички чөйрөсүндөгү ички чип өндүрүүчүлөр үчүн мүмкүнчүлүктөр окутуунун кесепетинен өтө жогору талаптарга жооп берүүнүн эсебинен айкыныраак. Аналитиктердин ата мекендик корутунду карталарын колдонуу жетиштүү болгон деп ырастайт; Керек болсо, кошумча машинаны алуу мүмкүн болсо, анда машыгуу моделдери уникалдуу көйгөйлөрдү жаратат - машиналардын көбөйүшүн башкарат жана чоңураак ката чендеринде окутуунун натыйжаларына терс таасирин тийгизиши мүмкүн. Тренингдин конкреттүү кластер шкаласы боюнча талаптар бар, ал эми корутунду алуу үчүн талаптар GPU талаптарын жеңилдетүү катаал эмес. Учурда NVIDIAнын бирдиктүү H20 картасынын аткарылышы Huawei же Cambrian компаниясынын ишинен ашып түшпөйт; Анын күчү кластердик. "Чоң машыгуу, рыноктук окутуу, рыноктук маселелер, рынокко суроо-талаптын негизин убактылуу кыскартууга жана рыноктун суроо-талаптын негизинде бир кыйла төмөндөшү мүмкүн. Ушул себептен улам, ушул себептен улам, туруктуу суроо-талап эсептөө күчтөрүнүн рыногунда ". Андан тышкары, "Депсек" потенциалга болгон талаптарга суроо-талаптын көтөрүлүшүн жогорулатуу үчүн, жергиликтүү мүмкүнчүлүктөрдүн калдыктарын ченемдүүлүктү орнотууга шайкеш келет, анда таштандыларды туруктуу ресурстардын пост-пост-чеберчилигине жумшартууга жардам берет; Бул ички эсептөөчү экосистеманын ар кандай деңгээлдеринде өндүрүүчүлөр үчүн өндүрүүчүлөр үчүн пайдалуу мүмкүнчүлүктөрдү жаратат. " Лючен технологиясы Huawei булуту менен биргеликте демонстрациялык R1 сериялуу APIs жана ички эсептөө бийлигинин негизинде булутка элестетүү кызматтарын иштетүү үчүн кызматташкан. Сиз келечек жөнүндө оптимизмди билдирдиңиз: "Deepsec үй-бүлөлүк өндүрүлгөн чечимдерге ишеним арткандыгына ишенимин туудурат.

微信图片 _20240614024031.jpg1

Корутунду

Терептектин "жакшыраак" деп аталганга караганда "жакшыраак" болобу, колдонуучунун конкреттүү муктаждыктарына жана милдеттерине жараша болот. Ийкемдүүлүккө, арзан баада жана өзгөчөлөштүрүүгө муктаж болгон милдеттер үчүн DeepDEEK болушу мүмкүн. Чыгармачыл жазуу үчүн, жалпы иликтөө үчүн, Колдонуучуга достук сүйлөшүү интерфейси, Чатгпт жетекчиликти колго алышы мүмкүн. Ар бир курал ар кандай максаттарга кызмат кылат, андыктан тандоого алар колдонула турган контекстке көз каранды.

ELV кабелинин чечимин табыңыз

Control кабелдерин башкаруу

BMS, автобус, өнөр жай, инструментация кабели үчүн.

Структураланган кабля системасы

Тармак жана маалыматтар, була-оптикалык кабель, патч зым, модулдар, бөтөнчө

2024-жылдагы көргөзмө жана окуяларды карап чыгуу

Apr.16th-18th, 2024 орто-чыгыш-чыгыш-энергия

Apr.16th-18th, 2024

Окт.22ND-25th, 2024 Коопсуздук Пекинде

Nov.19-20, 2024


Пост убактысы: FEB-10-2025