Watsonx.ai je sada nástrojů od IBM pro umělou inteligenci a podnikové datové platformy nad ověřenými daty a IBM připravila pro AI některé základní modely. Tento článek se předpřipravenými základními modely.
Nové watsonx.ai studio od IBM nabízí soubor základních modelů zaměřených na poskytování hodnoty podnikům. Byly začleněny do řady produktů IBM, které budou dostupné zákazníkům IBM v následujících měsících.
Na základě poznatku, že jedna velikost nestačí všem, postavili v IBM rodinu a kódy základních modelů různých velikostí a architektur. Každá rodina modelů dostala kódové jméno podle geologických témat – Granite, Sandstone, Obsidian a Slate (Břidlice), které přinášejí inovace z IBM Research a komunity otevřeného vývoje (open research). Každý model může být zákaznicky upraven pro různé podnikové úlohy.
Modely Granite jsou založeny na architektuře dekódování podobnému GPR pro generativní úlohy. Modely Sandstone využívají architekturu kodér-dekodér a jsou dobře využitelné pro jemné ladění na specifické úlohy, zaměnitelné s oblíbenými modely Google T5. Modely Obsidian využívají novou modulární architekturu vyvinutou v IBM Research, které poskytuje vysokou vnitřní efektivitu a úroveň výkonu napříč různými úlohami. Slate odpovídá rodině modelů typu pouze kodér (RoBERTa-based), které sice nejsou generativní, ale jsou rychlé a efektivní pro mnoho podnikových úloh typu NLP. Všechny modely watsonx.ai jsou učeny na prověřeném datovém souboru (data lake) zaměřeném na podniky, na upraveném cloudově nativním AI superpočítači Vela.
Základními principy návrhu jsou pro watsonx.ai efektivita a udržitelnost. V IBM Research vyvinuli pro učení modelu nové technologie, včetně vlatního algoritmu „LiGO“, který recykluje malé modely a nechává je vyrůst do větších. Tato metoda umožňuje ušetřit od 40 % do 70 % času, nákladů, karbonové stopy, potřebných k učení modelu. K zlepšení odvození rychlostí povýšili vlastní hlubokou expertízu v kvantování, nebo jinak ve smršťování modelů z 32bitové aritmetiky s plovoucí desetinnou čárkou do o mnoho menších celočíselných bitových formátů. Omezení přesnosti modelu AI dává velké přínosy efektivity bez obětování správnosti. V IBM věří, že budou brzy moci spouštět tyto modely na vlastním čipu optimalizovaném pro AI, IBM AIU.
Hybridní cloudové nástroje pro základní modely
Konečným dílem skládačky základního modelu je vytvoření jednoduše použitelné platformy pro modely ladění a nasazení. Hybridní, cloudově nativní deduktivní zásobník (inference stack), postavený na RedHat OpenShift, byl optimalizován pro učení a obsluhu základních modelů. Podniky mohou zvýšit flexibilitu OpenShiftu pro spouštění modelů odkudkoliv, včetně vlastního výpočetního prostředí.
V IBM vytvořili ve watsonx.ai soubor nástrojů, který poskytuje zákazníkům pro řešení založená na základních modelech uživatelsky příjemné prostředí a pro vývojáře snadno použitelné knihovny. Prompt Lab umožňuje uživatelům rychle vykonávat úlohy AI jen s několika označenými příklady. Tuning Studio umožňuje rychlé a robustní zákaznické přizpůsobení modelu s využitím vlastních dat, založené na nejlepších a jemně vyladěných technikách vyvinutých v IBM Research.
Jako přídavek k vlastním modelům IBM poskytuje watsonx.ai podnikům jednoduchý přístup k širokému katalogu modelů open source pro experimentování a rychlou iteraci. IBM nabízí ve watsonx.ai s novým partnerstvím s Hugging Face tisíce základních modelů open source od Hugging Face, soubory dat a knihoven. Hugging Face bude na oplátku nabízet veškeré modely od IBM a modely a nástroje otevřeného přístupu ve watsonx.ai.
Pokud chcete vyzkoušet nový model, jednoduše si jej vyberete z drop-down menu. Více o studiu se dozvíte v tomto odkazu.
Výhled do budoucna
Základní modely mění celý prostor AI a pokrok v posledních letech se jen zrychluje. V IBM pomáhají načrtnout hranice tohoto rychle se rozvíjejícího se pole a podnikům přetvořit inovace do skutečné hodnoty.