Pro úspěšné nasazení GenAI musí společnosti přehodnotit, přebudovat a optimalizovat svá úložiště tak, aby efektivně zvládala velké požadavky umělé inteligence na správu dat.
Umělá inteligence (AI) a generativní umělá inteligence (GenAI) jsou jedny z nejžhavějších technologií roku 2023. Organizace a firmy se předhánějí, aby využily jejich výhod. V nedávném průzkumu společnosti Dell Technologies mezi vedoucími IT pracovníky jich 76 % uvedlo, že dopad GenAI na jejich organizace očekávají významný až transformační. Analytici McKinsey navíc odhadují, že generativní umělá inteligence by globální ekonomice mohla přinést 2,6 až 4,4 bilionu dolarů ročně.
Rozvoj GenAI přispívá k růstu nejen v oblasti ekonomiky, ale především objemu dat na vstupu i výstupu. K vytvoření a trénování modelů je totiž potřeba obrovské množství informací. Modely pak následně generují další kvanta dat, která proudí zpět do firmy. Jednu z prvních otázek ohledně GenAI, kterou by si manažeři měli položit, zní: Jsou naše úložiště připravena na tento úkol?
Rok 2024 se stane zlomovým okamžikem, kdy se od sebe jasně odliší firmy, které se závodu s umělou inteligencí pouze účastní, od těch, které v něm vedou. Tím pomyslným dělítkem bude škálovatelná, bezpečná a hospodárně fungující datová architektura.
Řešení pro ukládání dat ve věku GenAI
Pro úspěšné nasazení GenAI musí společnosti přehodnotit, přebudovat a optimalizovat svá úložiště tak, aby efektivně zvládala velké požadavky umělé inteligence na správu dat. Jen tak se vyhnou možnému zpomalení procesů v důsledku nedostatečného nebo nevhodně navrženého úložiště.
Tradiční systémy pro ukládání dat již dnes nestíhají držet krok s informační explozí. Rozvoj systémů GenAI a řešení nových, složitějších úkolů jejich situaci ještě více zkomplikuje. Jinými slovy: platformy pro ukládání musí být přizpůsobeny složité situaci kolem nestrukturovaných dat, známých také jako kvalitativní data, a novým potřebám GenAI.
Nestrukturovaná data aktuálně tvoří více než 90 % ročního objemu dat. Jejich hlavním zdrojem jsou lidé. To znamená, že jsou tvořena nepřehlednými, neuspořádanými a chaoticky vyhlížejícími informacemi. Společnosti potřebují nové způsoby, jak při rozumných nákladech ukládat data takového rozsahu a složitosti, poskytovat k nim snadný a rychlý přístup a ještě je chránit před kybernetickými zločinci. Zejména nestrukturovaná data jsou totiž pro hackery zajímavá kvůli své hodnotě a obrovskému objemu.
Jednoduše řečeno, firmy u svých dat chtějí a očekávají lepší cirkulaci, přístup, škálovatelnost a ochranu. Jako rychlé řešení mnoho z nich zvolilo strategii „cloud-first“, kdy jsou data rozprostřena mezi více veřejných cloudů. To sice představuje schůdné řešení v krátkodobém horizontu, ale z dlouhodobého hlediska přináší rostoucí náklady na vstupu a výstupu, obavy o bezpečnost a problémy s optimalizací dat. Aby se GenAI skutečně prosadila, potřebuje jednoduchý a snadný přístup k datům – což strategie „cloud-first“ jen těžko zajistí.
Oproti tomu filozofie „Multicloud by design“ společnostem pomůže využít plný potenciál cloudových úložišť v krátkodobém i dlouhodobém horizontu, aniž by je omezovaly nesourodé ekosystémy proprietárních nástrojů a služeb. Takovýto přístup přináší konzistentní správu ukládání, ochrany a zabezpečení dat v multicloudových prostředích.
Investice do nových technologií skladování dat
Kvůli specifickým požadavkům GenAI a rozsáhlým, různorodým souborům dat potřebují podniky aplikovat inovativní přístupy ke skladování informací jako jsou distribuované ukládání, komprese a indexování.
• Distribuované úložiště zvyšuje škálovatelnost a spolehlivost systémů GenAI tím, že data ukládá na více místech. Společnosti tak mohou například rychle škálovat svá úložiště v několika uzlech, kdykoliv se zvýší poptávka. V uzlech také mohou replikovat a zálohovat svá nejkritičtější data pro snadnou obnovu v případě kybernetického útoku.
• Dalším klíčovým parametrem mnoha společností jsou náklady. Tento problém mohou do jisté míry vyřešit pomocí komprese dat. Efektivnější analýzou a odstraněním nepotřebných informací vznikne souhrnnější verze dat, která následně snižuje nároky na objem úložiště a šetří finance.
• Indexování dat zlepšuje schopnost jejich zpracování tím, že je účinněji organizuje do konkrétních míst. Přispívá k rychlejšímu a efektivnějšímu vyhledávání. Usnadňuje také tréning modelů a systémů GenAI.
Kombinace těchto tří metod má pozitivní vliv na výkon, efektivitu a úsporu nákladů. Jedná se o klíčové priority pro manažery, kteří chtějí bezproblémový a hladký přechod na technologie GenAI.
V případě generativní umělé inteligence je samozřejmě lákavé začít rovnou s jejím zaváděním, trénováním a praktickou aplikací. Ovšem aby byla GenAI úspěšná, prvním krokem musí být vytvoření pevného základu pro ukládání dat. Pro manažery ve vedení firem to možná není nejzajímavější téma, ale způsob, jakým společnosti ukládají a spravují data, bude v budoucnu hnacím motorem jejich rostoucí obchodní hodnoty.
Umělá inteligence a GenAI jsou významnými nástroji konkurenční výhody a způsobu, jak změnit poměr sil na trhu. Musí však být správně nasazeny. Stejně jako v každém jiném zápase, také závod o využití umělé inteligence vyžaduje poctivou přípravu a skvělou kondici. Kdo nic nepodcení a vybaví se technologiemi odolnými vůči budoucnosti, získá před ostatními výrazný náskok.
Autor: Priel Canal, specialista na AI z české pobočky Dell Technologies