Čínský technologický gigant Alibaba uvedl na trh dva modely umělé inteligence (AI). Jeden podle společnosti dokáže porozumět obrázkům a druhý navíc vede složitější konverzace než předchozí produkty Alibaby. Informoval o tom dnes zpravodajský server CNBC.
Oba nové modely AI společnosti Alibaba, Qwen-VL a Qwen-VL-Chat, budou mít otevřený zdrojový kód. Výzkumní pracovníci, akademici a společnosti po celém světě je tedy mohou používat k vytváření vlastních aplikací umělé inteligence, aniž by museli trénovat své vlastní systémy, čímž ušetří čas a náklady.
Společnost Alibaba informovala, že Qwen-VL dokáže odpovídat na dotazy týkající se různých obrázků a generovat k nim popisky. Čínská společnost uvedla jeden příklad zadání, na němž je v čínštině zobrazena nemocniční cedule. Umělá inteligence dokáže na základě interpretace obrázku odpovídat na otázky týkající se umístění určitých oddělení dané nemocnice.
Služba Qwen-VL-Chat zvládá „složitější interakce“, jako je porovnávání více obrazových vstupů a odpovídání na sérii otázek. Druhý ze jmenovaných nástrojů podle Alibaby umí mimo jiné psát příběhy, vytvářet obrázky na základě fotografií, které uživatel vloží, a také řešit matematické rovnice zachycené na snímku.
Dosud se velká část generativní umělé inteligence – kdy technologie generuje odpovědi na základě lidských vstupů – zaměřovala na odpovědi na text. Nejnovější verze služby ChatGPT od společnosti OpenAI umí porozumět obrázkům a odpovídat textem podobně jako Qwen-VL-Chat.
Dva poslední modely společnosti Alibaba stojí na velkém jazykovém modelu (LLM) společnosti nazvaným Tongyi Qianwen, který firma představila na začátku tohoto roku. LLM je model umělé inteligence vycvičený na obrovském množství dat a je základem aplikací chatbotů.
Alibaba sice nezíská žádné licenční poplatky, ale distribuce otevřeného kódu pomůže společnosti získat více uživatelů pro svůj model AI. Cloudová divize firmy se snaží znovu nastartovat růst, protože se připravuje na vstup na burzu.