„DeepSeek“ teigia, kad jo samprotavimo modelis tam tikrais standartais lenkia OpenAI o1

Kinijos AI laboratorija „DeepSeek“ išleido atvirą „DeepSeek-R1“ versiją, vadinamąjį samprotavimo modelį, kuris, jos teigimu, veikia taip pat gerai, kaip „OpenAI o1“ pagal tam tikrus AI etalonus.

R1 galima įsigyti iš AI dev platformos Hugging Face pagal MIT licenciją, tai reiškia, kad jį galima naudoti komerciniais tikslais be apribojimų. Anot „DeepSeek“, R1 lenkia o1 pagal etalonus AIME, MATH-500 ir SWE-bench Verified. AIME naudoja kitus modelius modelio veikimui įvertinti, o MATH-500 yra tekstinių problemų rinkinys. Tuo tarpu SWE-bench Verified daugiausia dėmesio skiria programavimo užduotims.

Būdamas samprotavimo modelis, R1 efektyviai patikrina faktus, o tai padeda išvengti kai kurių spąstų, kurie paprastai suveikia modelius. Samprotavimo modeliai užtrunka šiek tiek ilgiau (paprastai nuo sekundžių iki minučių ilgiau), kad būtų rasti sprendimai, palyginti su įprastu nemotyvuojančiu modeliu. Privalumai yra tai, kad jie paprastai yra patikimesni tokiose srityse kaip fizika, mokslas ir matematika.

R1 yra 671 milijardas parametrų, „DeepSeek“ atskleidė techninėje ataskaitoje. Parametrai apytiksliai atitinka modelio problemų sprendimo įgūdžius, o modeliai su daugiau parametrų paprastai veikia geriau nei turintys mažiau parametrų.

671 milijardas parametrų yra didžiulis, tačiau „DeepSeek“ taip pat išleido „distiliuotas“ R1 versijas, kurių dydis svyruoja nuo 1,5 milijardo parametrų iki 70 milijardų parametrų. Mažiausias gali veikti nešiojamuoju kompiuteriu. Kalbant apie visą R1, tai reikalauja galingesnės įrangos, bet tai yra galima per „DeepSeek“ API 90–95% pigiau nei „OpenAI“ o1.

Yra R1 minusas. Kadangi tai yra Kinijos modelis, jį tikrina Kinijos interneto reguliavimo institucija, siekdama užtikrinti, kad jos atsakymai „įkūnytų pagrindines socialistines vertybes“. R1 neatsakys į klausimus apie, pavyzdžiui, Tiananmenio aikštę ar Taivano autonomiją.

DeepSeek R1 atsisakymas — R1 filtravimas veikia. **Vaizdo kreditai:**DeepSeek

Daugelis Kinijos AI sistemų, įskaitant kitus samprotavimo modelius, atsisako reaguoti į temas, kurios gali sukelti šalies reguliavimo institucijų pyktį, pavyzdžiui, spekuliacijas apie Xi Jinping režimą.

R1 atvyksta praėjus kelioms dienoms po to, kai baigianti Bideno administracija pasiūlė griežtesnes eksporto taisykles ir AI technologijų apribojimus Kinijos įmonėms. Kinijos įmonėms jau buvo neleista pirkti pažangių DI lustų, tačiau jei naujosios taisyklės įsigalios taip, kaip parašyta, įmonės susidurs su griežtesniais puslaidininkių technologijų ir modelių, reikalingų paleisti sudėtingas dirbtinio intelekto sistemas, ribos.

Praėjusią savaitę paskelbtame politikos dokumente OpenAI paragino JAV vyriausybę remti JAV dirbtinio intelekto plėtrą, kad Kinijos modeliai neprilygtų arba nepralenktų jų pajėgumų. Interviu „The Information“ „OpenAI“ politikos viceprezidentas Chrisas Lehane’as išskyrė „High Flyer Capital Management“, „DeepSeek“ patronuojančią įmonę, kaip ypatingą susirūpinimą keliančią organizaciją.

Iki šiol mažiausiai trys Kinijos laboratorijos – „DeepSeek“, „Alibaba“ ir „Kimi“, kuri priklauso Kinijos vienaragiui „Moonshot AI“ – pagamino modelius, kurie, jų teigimu, konkuruoja o1. (Pažymėtina, kad „DeepSeek“ buvo pirmasis – lapkričio pabaigoje jis paskelbė apie R1 peržiūrą.) Įraše X Deanas Ballas, DI tyrinėtojas iš George’o Masono universiteto, teigė, kad tendencija rodo, kad Kinijos AI laboratorijos ir toliau bus „ greiti sekėjai“.

„Įspūdingas „DeepSeek“ distiliuotų modelių našumas (…) reiškia, kad labai pajėgūs argumentai ir toliau daugės ir bus naudojami vietinėje aparatinėje įrangoje“, – rašė Ballas, „toli nuo bet kokio valdymo režimo iš viršaus į apačią“.

Source link