Softver
Vesti
Phi-3 pokazuje iznenađujuću moć lokalnih jezičkih modela
Mali, a rečit!
Ivan JAKIĆ
24. april 2024.

Kompanija Microsoft je objavila novi, besplatni jezički model pod imenom Phi-3-mini, koji je jednostavniji i jeftiniji za „održavanje” i upotrebu od tradicionalnih velikih jezičkih modela, poput GPT-4 Turbo. Kompaktna veličina je idealna za lokalno pokretanje, što bi moglo da imitira sposobnosti besplatne verzije jezičkog modela kompanije OpenAI ,ChatGPT, ali ne zahtevajući aktivnu internet konekciju.



Glavna „merna jedinica” za veličinu u polju veštačke inteligencije jeste broj parametara. Parametri su numeričke vrednosti u neuronskoj mreži, koje određuju način na koji jezički model obrađuje i generiše tekst. Veliki skupovi podataka se koriste u toku treniranja jezičkih modela, koji se eksponencijalnim enkodiranjem predstavljaju kao znanje. Veći broj parametara omogućava modelu da obradi više kompleksnih slojeva generisanja jezika, ali istovremeno zahteva proporcijalno više računarskih resursa za pokretanje. 



Najveći jezički modeli današnjice, poput PaLM 2 kompanije Alphabet, poseduju na stotine milijardi parametara. Pretpostavlja se da GPT-4 raspolaže sa preko bilion parametara raspoređenih u osam modela sa po 220 milijardi. Oba modela zahtevaju moćne grafičke čipove smeštene u data centre kako bi se pravilno pokretali. 



Kontrastno trendu, Microsoft je odlučio da „cilja” na manje dimenzije sa Phi-3-mini, koji sadrži samo 3.8 milijardi parametara treniranih na 3.3 billiona tokena. Takve karakterisitke ga čine idealnim za pokretanje na komercijalnim grafičkim karticama ili hardveru posvećenom veštačkoj inteligenciji, koji poseduju mobilni uređaji novije generacije. Phi-3 je prirodna evolucija prethodna dva „mala” jezička modela kompanije Microsoft — Phi-2, objavljenog u decembru i Phi-1, objavljenog u junu 2023. godine. Pored standardne Phi-3-mini verzije, predstavljena je i jača, Phi-3-mini-128K, koja shodno nazivu poseduje 128 hiljada tokena, čineći ga trideset i dva puta „elokventnijim” od originala. Kreirane su i verzije sa sedam i četrnaest milijardi parametara, za koje softverski gigant tvrdi da su značajno sposobnije. 



Phi-3 bi trebalo da poseduje ukupne performanse konkurentne modelima Mixtral 8x7B i GPT-3.5, sudeći po dokumentovanoj mašti Microsoft inženjera pod nazivom „Tehnički izveštaji o Phi-3: Visoko sposoban jezički model na vašem telefonu”. Zahtevajući manje od osam gigabajta RAM, Phi-3 može da generiše tokene podnošljivom brzinom i na običnom procesoru. Pošto je pod MIT licencom, moći će da se ugodno pokrene i na uređajima popu Raspberry Pi, dok bi kvalitet rezultata trebalo da parira četiri puta većim modelima. Ukoliko se ovaj mališan pokaže uspešno na testovima, mogao bi da predstavlja vodiča koji će da obesmisli potrebu za velikim modelima iz data centara, barem za svakodnevne zadatke običnih korisnika.



Interakcija sa Phi-3 je dostupna na Azure platformi, kao i putem partnerskih platformi za modele mašinskog učenja, Hugging Face i Ollama — framework koji omogućava lokalno izvršavanje Phi-3 na računarima.  

Microsoft
Phi-3-mini
LLM
AI
PRETHODNI TEKST
SLEDEĆI TEKST
Najčitanije
Igre
Telefoni
Hardver
Softver
Nauka
Aktuelno štampano izdanje
MAJ 2024
Novosti na polju razvoja dronova
Budućnost ratovanja
Sve popularniji su mali i povoljni dronovi, sposobni da lansiraju rakete za koje su bile neophodne mnogo skuplje letelice...
Gigabyte G6X (9MG 2024)
Nešto priuštiviji
Zahvaljujući odličnom rashladnom sistemu, ovaj laptop iz ugrađenih CPU i GPU čipova izvlači maksimum...
Asus NUC13BRF i NUC14RVH
NUC-evi iz nove kuhinje
Asus je preuzeo NUC (Next Unit of Computing) od Intela i evo prva dva modela iz njihove radinosti...
Nacon Daija
Premijum arkada
Mnogi igrači žele da arkadni doživljaj imaju kod kuće, da biju po tasterima japanske radinosti i čupaju arkadnu palicu...
Huawei FreeClip
Muzičke minđuše
Osim što izgledaju futuristički, ove „muzičke minđuše” su izuzetno udobne za nošenje i to omogućavaju bez bojazni od ispadanja...
Samsung Galaxy A35 i A55
Aktuelni A , puta dva
Oba telefona su dizajnerski uspešne kopije vrhunskih modela S serije...
Everything 1.4.1 • TreeSize Free 4.72 • LockHunter 3.4.3 • SyncBackFree 11.3 • WiFi Password Revealer • Keyfinder 2.0
Pet (i po) korisnih programa za Windows
Na primer, Everything je brza mašina za pretragu lokalno uskladištenog materijala, koja koristi izuzetno malo hardverskih resursa...
Kriza u industriji i TSMC
Nesigurnost i obećanja
Planovi TSMC-a za fabrike u Arizoni suočili su se sa višestrukim preprekama tokom uspostavljanja projekta...
.rs: Aplikacije javnih preduzeća • Toll4All • UA Day 2024
Početak e Kartona
Javni beležnici imaće direktnu komunikaciju sa kolegama iz EU...
No Rest for the Wicked
U duhu ranijih naslova autora ove igre, njen vizuelni identitet uspeva da balansira sa mračnim i prelepim...
Stellar Blade
Stellar Blade je Sekiro-lite, gde „lite” ne podrazumeva manju kompleksnost, već, naprosto, manji stepen izazova...
Horizon Forbidden West – Complete Edition (PC)
Maksimalno kvalitetan PC port, sa DLC-om koji nastavlja originalnu priču, ali nije pravi nastavak...
© 2024 Svet kompjutera. Sva prava zadrzana.
Novi broj - Arhiva - Forum - O nama