• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025
| Komentujeme
Chvála černých skřínek

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které se v souvislosti s umělou inteligencí na zahraničních vědeckých i technologických webech zmiňuje poměrně často: „zmenšení“ AI. Namísto velkých jazykových modelů LLM můžeme očekávat důraz na modely menší, respektive kompozitní architekturu.
Důvodů je hned několik: menší modely jde snáze provozovat přímo na koncových zařízeních, což snižuje rizika spojená s přesouváním dat (do firemního datového centra) nebo přímo s jejich předáváním třetí straně (při používání „veřejných“ služeb AI na serverech poskytovatele, při trénování modelů speciálně pro potřeby firmy…). Na koncových zařízeních se může provádět nejenom provoz, ale i trénování modelů.
Za druhé, méně robustní modely šetří energii a mohou ulevit těžce zkoušeným datovým centrům (tento problém se bude, jak se předpokládá, dále zvyšovat) – i když samozřejmě málokdo stojí o to, aby mu umělá inteligence vybíjela mobil. (Jinak úzkým hrdlem pro provoz i menšího modelu AI v koncovém zařízení bude nejspíš grafický procesor.)
Za třetí určitý typ aplikací potřebuje rychlé zpracování dat přímo u jejich zdrojů, tedy v edge prostředí. Okrajem infrastruktury přitom může být leccos.
A nakonec, menší, navzájem spolupracující modely mohou dávat i lepší výsledky. „Obecný“ model se může například spojovat se specializovaným, pokud usoudí, že otázka je na něj příliš odborná. V aplikaci pro daný obor si zase vystačíme přednostně se znalostmi určitého typu a důležité je opět hlavně to, aby model zjistil, kdy se má zeptat dál.
Viz také: Jak naučit modely umělé inteligence efektivně spolupracovat

Prakticky všechny podnikové aplikace jsou zaměřené „oborově“, prakticky žádná nepotřebuje znát informace (např.) o historii nebo zoologii.
Vědci z Princetonu a Stanfordu navrhli i provoz původně stejného LLM tak, že lokálně v zařízení poběží nějaká ořezaná verze (doslova se mluví o kompresi LLM). Takových algoritmů ovšem existuje více.
O budoucnosti menších modelů svědčí i to, že už je nabízejí také poskytovatelé těch velkých: Google, Microsoft, Meta a OpenAI a Amazon. A pokud menší modely fungují v režimu pro více uživatelů, pak jsou při stejné zátěži zdrojů pochopitelně rychlejší a zvládnou obsloužit současně více uživatelů.
A co se týče kompozitní architektury, Nicolas de Bellefonds z Boston Consulting Group dokonce navrhl následující uspořádání: vstupní interakci s uživatelem povede pouze velmi malý model, jehož jediným úkolem bude posoudit složitost otázky (takže porozumět jí ale bude muset dost přesně) a rozhodnout, který konkrétní, respektive jak velký model bude potřeba k jejímu zodpovězení; kdy „jak velký“ znamená „jaký nejmenší možný“…

Rubriky: Technologie

Související příspěvky

Články

IDC: Trh podnikových sítí WLAN vzrostl meziročně o 10,6 %

4. 7. 2025
Zprávičky

Evropská komise: Kodex postupů na pomoc firmám s AI by mohl být na konci roku

4. 7. 2025
Zprávičky

V Temelíně testují autonomní drony

4. 7. 2025
Umělá inteligence: Nástroje vs. platforma, věda vs. kreativita
Zprávičky

Nástroj AI překonává lékaře v diagnostice složitých případů, tvrdí Microsoft

3. 7. 2025

Zprávičky

Spotřeba mobilních dat Čechů v zahraničí loni stoupla v průměru o desetinu

ČTK
8. 7. 2025

Češi loni v létě spotřebovali v zahraničí v průměru 1,89 gigabajtu (GB) dat na

Rusko vypne signál cizincům, kteří ke svým SIM kartám nedoplní biometrické údaje

ČTK
8. 7. 2025

Ruské úřady chtějí postupně vypnout mobilní spojení těm cizincům, kteří ke svým SIM kartám

Shein podal žádost o vstup na hongkongskou burzu, chce zvýšit tlak na Brity

ČTK
8. 7. 2025

Čínský prodejce rychlé módy Shein podal žádost o vstup na hongkongskou akciovou burzu. Firma

Kriminalisté vyšetřují kyberútok na Nemocnici Nymburk i kvůli vydírání

ČTK
7. 7. 2025

Krajští kriminalisté vyšetřují kybernetický útok na Nemocnici Nymburk z minulého týdne kvůli neoprávněnému přístupu

USA v pondělí či v úterý budou mluvit s Čínou o TikToku, řekl Trump

ČTK
6. 7. 2025

Prezident Donald Trump prohlásil, že Spojené státy v pondělí nebo v úterý budou jednat

Technologičtí giganti bojují o experty na AI astronomickými odměnami

ČTK
5. 7. 2025

Technologické společnosti jako Meta, OpenAI nebo Alphabet vedou stále intenzivnější boj o špičkové experty

Ransomwarový útok stojí české oběti 8,25 milionu korun

Hackerský útok paralyzoval fungování městského úřadu v Uničově na Olomoucku

ČTK
4. 7. 2025

Hackerský útok vyřadil tento týden z provozu městský úřad v Uničově na Olomoucku. Radnice

Sophos představil XDR řešení pro synchronizované zabezpečení

Nemocnice Nymburk po kyberútoku dál obnovuje systémy,černé scénáře se nenaplnily

ČTK
4. 7. 2025

V nymburské nemocnici pokračují v obnově informačních systémů po úterním kybernetickém útoku, obnova zřejmě

Tiskové zprávy

Acer for Business EMEA překonává růst trhu

Nejnovější modely Acer Chromebook Plus nyní s 12měsíčním balíčkem Google AI Pro včetně služby NotebookLM zdarma

ANECT mění vedení společnosti a posiluje management

Optimize by Acer: nejnovější evoluce v oblasti podnikových záručních podmínek

QNAP vylepšuje Qsync 6.0 Beta: Komplexní řešení pro zálohování a synchronizaci souborů

Sophos oznámil nový program MSP Elevate, podporuje růst i ziskovost poskytovatelů řízených služeb

Zpráva dne

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Květen je měsícem růstu, můžete růst s Windows 11 jen za €20.00!

Redakce
15. 5. 2025

Kupte Windows 11 CDkey od Goodoffer24.com a můžete růst s tímto OS jak při...

Videa ITBiz.cz

Vodafone otestoval Nokia 25G PON
Glenn Mallon, Dell Technologies

Elektronická recepční

FORXAI Mirror

Kamery pro průmysl a detekci požárů

Kamery pro vyhodnocení spokojenosti zákazníků

Kalendář

Zář 22
22. září @ 8:00 - 26. září @ 17:00

EMO Hannover 2025

Říj 1
Celý den

Cyber Attacks

Říj 21
Celý den

Bezpečnosť a dostupnosť dát

Zobrazit kalendář

Komentujeme

Chvála černých skřínek

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které...

Slovník

OMC

Buyer

BAS

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia. Hosting zajišťuje společnost Greenhousing.cz. Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace Veřejná správa Vývoj a HTML Zpráva dne České IT

Píšeme jinde

RSS ScienceMag RSS

  • Jak „dýchá“ Europa: koloběh ledu a místní tektonika
  • Unikátní nález laténského sídliště
  • 3D modely cév usnadní operace rakoviny tlustého střeva

RSS AbcLinuxu RSS

  • IBM Power11
  • Ardour pouze s YTK (fork GTK2)
  • Parrot OS 6.4
Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.