Amazon udostępnia swój model językowy Falcon

Amazon Web Sercvices
Amazon Web Sercvices, fot. Shutterstock
Technology Innovation Institute (TII) w Abu Zabi przeszkolił swój duży model językowy Falcon 40B na AWS. Narzędzie będzie już dostępne dla użytkowników.

Zyskaj dostęp do bazy artykułów z „My Company Polska” Zamów teraz!

Amazon Web Services (AWS) ogłosił, że Technology Innovation Institute (TII) w Abu Zabi przeszkolił swój duży model językowy Falcon 40B na AWS. Falcon LLM, podstawowy duży model językowy (LLM), ma imponującą pojemność 40 miliardów parametrów i został wytrenowany na 1 bilionie tokenów. Został zbudowany od podstaw przy użyciu wstępnego przetwarzania danych i zadań szkoleniowych modelu zbudowanych na Amazon SageMaker. 

Falcon. Co potrafi nowy model 

Jak twierdzi firma, model Falcon 40B wykazał się wysoką wydajnością i dokładnością i jest najwyżej sklasyfikowanym modelem open-source w publicznej tabeli liderów Hugging Face Open LLM.

Użytkownicy mogą uzyskać dostęp do Falcon 40B za pośrednictwem Amazon SageMaker, aby wykorzystać jego możliwości w aplikacjach takich jak tłumaczenie, odpowiadanie na pytania, podsumowywanie i identyfikacja obrazów.

Falcon 40B umożliwia użytkownikom konstruowanie i dostosowywanie narzędzi AI, ułatwiając płynną integrację i zapewniając długoterminową ochronę zasobów danych. Wagi modeli są dostępne do pobrania, sprawdzenia i wdrożenia w dowolnym miejscu.

Falcon LLM jest również dostępny w Amazon SageMaker JumpStart, centrum uczenia maszynowego (ML) SageMaker, które oferuje wstępnie wytrenowane modele, wbudowane algorytmy i gotowe szablony rozwiązań, aby pomóc użytkownikom szybko rozpocząć pracę z ML. Każdy może wdrożyć i używać Falcon LLM za pomocą kilku kliknięć w SageMaker Studio lub programowo za pośrednictwem SageMaker Python SDK. Więcej informacji na temat Falcon 40B można znaleźć w tym wpisie na blogu.

Na początku tego roku AWS ogłosił szereg innowacji w swoim portfolio uczenia maszynowego (ML), aby wspierać generatywne aplikacje AI, w tym usługę w chmurze o nazwie Bedrock do budowania generatywnych aplikacji AI oraz bezpłatny dostęp do Amazon CodeWhisperer dla indywidualnych programistów. 

Amazon Bedrock: co to za narzędzie

Amazon Bedrock to nowa usługa służąca do budowania i skalowania aplikacji wykorzystujących generatywną AI, czyli aplikacji, które mogą tworzyć teksty, obrazy, nagrania i dane syntetyczne zgodnie z otrzymanymi wskazówkami. 

Bedrock zapewnia dostęp do modeli językowych stworzonych przez dwa startupy zajmujące się opracowywaniem modeli językowych - Anthropic i AI21. AWS umożliwi również dostęp do Stable Diffusion, modelu sztucznej inteligencji służącego do generowania obrazów, oferowanego przez Stability AI - startup pracujący nad open-source’owymi, generatywnymi modelami AI. AWS stosuje dwa generatywne modele językowe – Titan Text potrafi generować tekst na bazie otrzymanych wskazówek, a Text Embeddings generuje matematyczne odzwierciedlenie tekstu, które może być użyte np. do tłumaczenia czy wyszukiwania.

Amazon zapewnia, że przekazywane systemowi dane wyciekną do ogólnej puli danych stosowanych do szkolenia modeli, co stanowi odpowiedź na jedno z najpoważniejszych zastrzeżeń zgłaszanych przez organizacje chcące budować własne generatywne produkty AI. Zwłaszcza firmy przetwarzające dane wrażliwe klientów (np. firmy z branży usług finansowych czy opieki zdrowotnej) obawiają się o bezpieczeństwo danych. 

ZOBACZ RÓWNIEŻ