tento týden probíhá hlavní událost roku společnosti Amazon Web Services: AWS re:Invent v Las Vegas. Zazní zde nejdůležitější oznámení týkající se AWS, jejich zákazníků i partnerů.
Hardwarové a čipové inovace
AWS Trainium2 je nyní k dispozici pro všechny uživatele(03. 12. 24) – AWS oznámilo všeobecnou dostupnost instancí Amazon EC2 poháněných AWS Trainium2, představila nové Trn2 UltraServery, které umožňují zákazníkům trénovat a nasazovat nejnovější AI modely i budoucí velké jazykové modely (LLM) a základní modely (FM) s výjimečnou úrovní výkonu a nákladové efektivity, a odhalila čipy nové generace Trainium3.
Hlavní přednosti:
Trn2 je nejvýkonnější instance Amazon EC2 pro hluboké učení a generativní AI: Instance Trn2 nabízejí o 30–40 % lepší poměr ceny a výkonu než současná generace GPU instancí EC2 P5e a P5en a obsahují 16 čipů Trainium2 poskytujících 20,8 petaflopů špičkového výpočetního výkonu – ideální pro trénování a nasazování LLM s miliardami parametrů.
Trn2 UltraServery splňují stále náročnější požadavky na AI výpočty pro největší světové modely: Amazon EC2 Trn2 UltraServery jsou zcela novou nabídkou EC2, která obsahuje 64 propojených čipů Trainium2 využívajících ultra-rychlé propojení NeuronLink, umožňující škálování až na 83,2 petaflopů špičkového výpočetního výkonu – což představuje čtyřnásobek výpočetního výkonu, paměti a síťové konektivity jediné instance.
Čipy Trainium3 – navržené pro vysokovýkonnostní potřeby další generace generativních AI úloh: Trainium3 bude první AWS čip vyrobený 3nanometrovým výrobním procesem, který stanoví nový standard pro výkon, energetickou účinnost a hustotu. Očekává se, že UltraServery poháněné čipy Trainium3 budou 4x výkonnější než Trn2 UltraServery, což zákazníkům umožní ještě rychlejší iterace při vytváření modelů a poskytování lepšího výkonu v reálném čase při jejich nasazení. První instance založené na Trainium3 by měly být k dispozici koncem roku 2025.
Zákazníkům je umožněno využít plný výkon Trainium2 pomocí softwaru AWS Neuron: AWS vydalo Neuron SDK, které nabízí nástroje pro optimalizaci modelů pro čipy Trainium. SDK se integruje s frameworky jako JAX a PyTorch, podporuje přes 100 000 modelů na Hugging Face model hubu a obsahuje rozhraní Neuron Kernel Interface (NKI) pro přímý přístup k hardwaru.
- Strojové učení (ML)/Umělá inteligence (AI)
- Představení Amazon Nova: Nová generace základních modelů (03. 12. 24) – Nové nejmodernější základní modely od Amazonu přinášejí špičkovou inteligenci a vedoucí poměr ceny a výkonu v daném odvětví. Nové modely Amazon Nova dostupné v Amazon Bedrock zahrnují:
- Amazon Nova Micro, čistě textový model, který poskytuje odpovědi s nejnižší latencí za velmi nízkou cenu.
- Amazon Nova Lite, velmi nízkonákladový multimodální model, který je bleskově rychlý při zpracování obrazu, videa a textových vstupů.
- Amazon Nova Pro, vysoce schopný multimodální model s nejlepší kombinací přesnosti, rychlosti a ceny pro širokou škálu úloh.
- Amazon Nova Premier, nejschopnější z multimodálních modelů Amazonu pro komplexní úlohy uvažování a pro použití jako nejlepší učitel pro destilaci vlastních modelů (dostupný v časovém rámci Q1 2025).
- Amazon Nova Canvas, nejmodernější model pro generování obrazu.
- Amazon Nova Reel, nejmodernější model pro generování videa.
- AWS posiluje Amazon Bedrock o bezpečnostní prvky AI jako první v oboru, řízení agentů a pokročilé možnosti přizpůsobení(03. 12. 24) – AWS oznámilo nové funkce pro Amazon Bedrock, plně spravovanou službu pro vytváření a škálování generativních AI aplikací s vysoce výkonnými základními modely. Tyto funkce pomáhají zákazníkům předcházet faktickým chybám způsobeným halucinacemi, koordinovat více AI agentů pro komplexní úlohy a vytvářet menší, na konkrétní úlohy zaměřené modely, které mohou podávat podobný výkon jako velký model, ale za zlomek nákladů a latence.
- AWS představuje novou generaci Amazon SageMaker: jednotnou platformu pro data, analytiku a umělou inteligenci (03. 12. 24) – AWS představilo novou generaci Amazon SageMaker, která sjednocuje funkce, které zákazníci potřebují pro rychlou SQL analytiku, zpracování velkých dat v petabajtovém měřítku, průzkum a integraci dat, vývoj a trénování modelů a generativní AI do jedné integrované platformy.
- Amazon Q
- Nové vývojářské nástroje Amazon Q urychlují rozsáhlou modernizaci stávajících aplikací a systémů (03. 12. 24) – AWS oznámilo nové funkce pro Amazon Q Developer, nejschopnějšího generativního AI asistenta pro vývoj softwaru, které přebírají časově náročnou rutinní práci při komplexních projektech migrace a modernizace aplikací, díky čemuž zákazníci a partneři ušetří čas i peníze.
- Amazon Q Developer přetváří vývoj a správu softwaru pomocí generativní umělé inteligence(03. 12. 24) – AWS představilo nová vylepšení služby Amazon Q Developer. Ta přináší agenty, kteří automaticky provádějí testování jednotlivých částí kódu, vytváří dokumentaci a kontrolují kód. Díky tomu mohou vývojáři pracovat rychleji během celého vývojového procesu. Součástí je také nová funkce, která výrazně zkracuje čas potřebný k řešení provozních problémů.
- Zákazníci rozšiřují využití Amazon Q Business díky inovacím, které mění způsob práce zaměstnanců (03. 12. 24) – AWS představilo nové možnosti a další rozvoj služby Amazon Q Business, nejvyspělejšího asistenta s generativní umělou inteligencí, který pomáhá nacházet informace, získávat poznatky a provádět pracovní úkoly.
- Databázové systémy & úložiště
- Amazon S3 rozšiřuje funkce: správa tabulek Apache Iceberg pro rychlejší analýzu dat a automatická tvorba metadat pro snadnější práci s daty (03. 12. 24) – AWS představilo nové funkce služby Amazon S3. Díky nim se Amazon S3 stává prvním cloudovým úložištěm, které nabízí plně spravovanou podporu Apache Iceberg. To přináší rychlejší analýzu dat a zjednodušuje ukládání a správu tabulkových dat bez ohledu na jejich velikost.
- Amazon S3 Tables nabízí nejjednodušší a nejrychlejší způsob analýzy dat uložených v Apache Iceberg tabulkách na S3. Dotazy na data jsou až třikrát rychlejší než dosud.
- Amazon S3 Metadata – služba, která nabízí nejrychlejší a nejjednodušší způsob, jak prozkoumat data uložená v S3 a porozumět jejich obsahu.
- AWS uvádí nové databázové funkce včetně nejrychlejší distribuované SQL databáze Amazon Aurora DSQL (03. 12. 24) – AWS rozšířilo možnosti databázových služeb Amazon Aurora a Amazon DynamoDB. Nové funkce cílí na zákazníky, jejichž aplikace vyžadují provoz ve více světových regionech současně. Služby garantují stejná data napříč všemi lokalitami, rychlou odezvu systému a nepřetržitý provoz. Tyto vlastnosti jsou k dispozici jak pro tradiční SQL databázi Aurora, tak pro moderní NoSQL databázi DynamoDB.
- Amazon Aurora DSQL je nová bezserverová, distribuovaná SQL databáze, která umožňuje zákazníkům vytvářet aplikace s nejvyšší dostupností, silnou konzistencí, kompatibilitou s PostgreSQL a 4x rychlejším čtením a zápisem ve srovnání s jinými populárními distribuovanými SQL databázemi.
- Amazon DynamoDB globální tabulky nyní podporují silnou konzistenci napříč více regiony, což zajišťuje, že aplikace zákazníků běžící ve více regionech vždy čtou nejaktuálnější data bez nutnosti měnit jakýkoliv aplikační kód.
Novinky zákazníků & partnerů
- Adobe a AWS uzavírají partnerství pro lepší využití Adobe Experience Platform a hlubší porozumění zákazníkům (03. 12. 24) – Adobe rozšiřuje své partnerství s AWS a zpřístupňuje platformu Adobe Experience Platform (AEP) v prostředí AWS. Toto nové řešení pomáhá firmám budovat lepší vztahy se zákazníky pomocí personalizovaného přístupu, který vychází z detailní analýzy dat. AEP se stal oblíbeným nástrojem značek, protože umožňuje sledovat chování zákazníků v reálném čase jak na internetu, tak v kamenných prodejnách. Díky tomu mohou firmy nabízet skutečně personalizovaný přístup i při velkém počtu zákazníků.
- PingCAP si vybírá AWS jako hlavního poskytovatele cloudových služeb pro globální rozvoj (03. 12. 24) – AWS oznámilo nové partnerství se společností PingCAP, která vyvinula databázovou službu TiDB Cloud. PingCAP si vybrala AWS jako hlavní cloudovou platformu pro své služby. Společnost těží z pokročilých technologií AWS, zejména v oblasti bezserverového provozu a bezpečnosti. Díky tomu může spolehlivě poskytovat své služby zákazníkům z různých odvětví: od finančnictví přes e-shopy až po herní průmysl. Zařazením služby TiDB Cloud do nabídky AWS Marketplace společnost významně rozšířila svůj dosah a nyní její služby využívají zákazníci ve více než 20 zemích světa.
- AWS a Riot Games oznamují vítěze hackathonu VALORANT Champions Tour: Výzva Esports manažera (03. 12. 24) – AWS a Riot Games vyhlásily vítěze hackathonu VALORANT Champions Tour (VCT) Esports Manager Challenge. Více než 3 200 účastníků pracovalo s nástroji umělé inteligence od AWS a reálnými daty z profesionálních zápasů od Riot Games. Jejich cílem bylo vytvořit nástroje pro hledání nových talentů do profesionálního VALORANTu a pro vývoj úspěšných herních strategií.
- AWS a GitLab představují integrované AI řešení pro rychlejší vývoj softwaru a vyšší produktivitu vývojářů (03. 12. 24) – AWS a GitLab oznámily propojení svých nástrojů GitLab Duo a Amazon Q. Toto spojení přináší vývojářům nové možnosti díky využití umělé inteligence. Vývojáři mohou používat osvědčené DevSecOps postupy z GitLabu společně s chytrými asistenty z Amazon Q. Výsledkem je rychlejší vývoj bezpečného softwaru.
- PagerDuty a AWS přinášejí výhody generativní AI pro lepší odolnost firem a jejich provozu(03. 12. 24) – PagerDuty oznámila nové funkce generativní AI a automatizace v PagerDuty Advance ve spolupráci s AWS. Nové možnosti AI umožňují týmům pro správu provozu využívat generativní AI a automatizaci pro rychlejší inovace, větší spolehlivost systémů a lepší péči o zákazníky.
- PwC a AWS posilují strategickou spolupráci pro transformaci firem s využitím generativní AI (03. 12. 24) – Společnosti PwC a AWS oznámily uzavření strategického partnerství. Jejich cílem je pomoci firmám modernizovat jejich podnikání využitím nejnovějších cloudových služeb a generativní umělé inteligence.
- LG AI Research vyvíjí na platformě AWS model AI pro rychlou diagnostiku rakoviny (03. 12. 24) – AWS oznámila spolupráci s LG AI Research, výzkumným centrem jihokorejské společnosti LG Group. Výzkumníci využili cloud AWS k vytvoření nového AI modelu pro oblast patologie, který pomáhá s včasnou diagnostikou a léčbou rakoviny. Jejich model nazvaný EXAONEPath dokáže bezpečně analyzovat mikroskopické snímky vzorků tkání pacientů s rakovinou. Výrazně tak urychluje genetické testování – z původních dvou týdnů na méně než minutu. Díky tomu mohou lékaři rychleji zahájit účinnou léčbu.
Startupy
- Startup pro generativní AI Twelve Labs spolupracuje s AWS na vývoji technologie, která umožní vyhledávat ve videích stejně snadno jako v textu (03. 12. 24) – AWS oznámilo spolupráci se startupem Twelve Labs. Tato společnost vyvíjí umělou inteligenci, která dokáže porozumět video obsahu podobně jako člověk. Twelve Labs své vlastní základní modely vytváří a provozuje na platformě AWS.