AI w Chrome

29 lipca 2024 | Dawid Ryłko

A modern blog page featuring an article about AI in Chrome, viewed from a computer screen perspective. The screen shows sections with code snippets, images of Chrome browser settings, and developers working on their computers. The header displays the title 'AI w Chrome' and the main content showcases images of Chrome flags settings, API usage, and sample code executions. The design is clean and professional, with a tech-savvy feel and vibrant visuals. Replace the area where the clock is with a wall clock. Remove any Chrome logos from the wall.

Wychodząc naprzeciw oczekiwaniom użytkowników oraz programistów, Google wprowadził eksperymentalne funkcje AI w przeglądarkach Chrome dla deweloperów (Canary i Dev). Dzięki temu już teraz możemy korzystać z najnowszego wbudowanego w przeglądarkę Gemini Nano. W tym artykule pokrótce przedstawię, jak skorzystać z tych funkcji.

Aby wyszukiwanie w internecie było łatwiejsze, bezpieczniejsze i bardziej dostępne, wprowadziliśmy do Chrome najnowsze systemy uczące się i technologie AI. Deweloperzy mogą wykorzystać tę technologię, aby zwiększyć komfort korzystania z internetu.

Instalacja

W celu skorzystania z najnowszych funkcji AI w Chrome, należy pobrać odpowiednią wersję przeglądarki. W momencie pisania tego artykułu funkcje AI są dostępne w wersji nightly dla deweloperów (Canary) oraz w wersji deweloperskiej:

Po instalacji odpowiedniej przeglądarki możemy zauważyć, że funkcje, które nas interesują, są domyślnie wyłączone.

Okno przeglądarki Chrome bez włączonego AI

Ustawienia

Aby skorzystać z nowych funkcji AI w Chrome, należy włączyć odpowiednie flagi. W tym celu wpisujemy w pasek adresu przeglądarki chrome://flags i klikamy enter. Następnie szukamy odpowiednich flag.

Prompt API for Gemini Nano - Enable

Enables the exploratory Prompt API, allowing you to send natural language instructions to a built-in large language model (Gemini Nano in Chrome). Exploratory APIs are designed for local prototyping to help discover potential use cases, and may never launch.
```
chrome://flags/#prompt-api-for-gemini-nano
```
Enables optimization guide on device - Enable BypassPerfRequirement

Enables the optimization guide to execute models on device. – Mac, Windows, Linux, ChromeOS, Lacros
```
chrome://flags/#optimization-guide-on-device-model
```

Po ustawieniu flag należy zrestartować przeglądarkę.

Komponent Optimization Guide On Device Model

Następnie przechodzimy do chrome://components i sprawdzamy, czy jest zainstalowany Optimization Guide On Device Model.

Jeżeli nie pojawił się na liście, należy wyłączyć/włączyć flagi, zrestartować przeglądarkę i powtarzać tę czynność aż do momentu, kiedy komponent się pojawi. Jeżeli czynność się powiodła, możemy zauważyć, że funkcje AI są dostępne.

Praca z `window.ai`

Tworzenie sesji wykonujemy za pomocą komendy createTextSession. Możemy również sprawdzić, czy możemy utworzyć sesję za pomocą komendy canCreateTextSession.

const session = await window.ai.createTextSession();

Teraz możemy wykorzystać sesję do interakcji z AI. W tym celu możemy wykorzystać komendę prompt lub promptStreaming.

Przykładowe wywołanie komendy prompt:

const result = await session.prompt('Hi! I am Dawid.');
console.log(result);

Przykładowe wywołanie komendy prompt: Tell me a joke

await session.prompt('Tell me a joke');

API

Window AI API

await window.ai.canCreateTextSession();
// 'readily'

Ta funkcja sprawdza, czy możliwe jest utworzenie sesji tekstowej AI. Zwraca wartość 'readily', jeśli jest to możliwe.

await window.ai.defaultTextSessionOptions();
// {temperature: 0.800000011920929, topK: 3}

Ta funkcja zwraca domyślne opcje konfiguracji sesji tekstowej AI. Opcje te obejmują parametry takie jak temperature i topK.

await window.ai.createTextSession(options);
// AITextSession {}

Ta funkcja tworzy nową sesję tekstową AI z podanymi opcjami. Zwraca obiekt AITextSession, który można wykorzystać do dalszej interakcji z AI.

Session API

await session.prompt('Hi! I am Dawid.');
// ' Hey Dawid!'

Ta funkcja wysyła komunikat tekstowy do sesji AI i zwraca odpowiedź. W tym przypadku AI odpowiada na przywitanie imieniem.

await session.promptStreaming('Hi! I am Dawid.');
// ReadableStream {locked: false}

Ta funkcja wysyła komunikat do AI i zwraca odpowiedź w formie strumienia danych. Jest to przydatne do przetwarzania większych ilości tekstu w czasie rzeczywistym.

await session.clone();
// AITextSession {}

Ta funkcja tworzy kopię istniejącej sesji tekstowej AI. Może być używana do rozpoczęcia nowej sesji z tymi samymi ustawieniami.

await session.destroy();
// undefined

Ta funkcja kończy sesję tekstową AI i zwalnia zasoby. Po jej wywołaniu sesja nie będzie już dostępna.

Instalacja

Ustawienia

Praca z window.ai

API

Window AI API

Session API

Źródła

Praca z `window.ai`